Mobile Information Systems

Research Article

RDMMFET: Representation of Dense Multimodality Fusion Encoder Based on Transformer

Ablation studies on VQA v2.0 test-dev with iterations and layers of each encoder.