Beyond Words: An Intelligent Human-Machine Dialogue System with Multimodal Generation and Emotional Comprehension

<table class="table-group" id="tab2"><tr><td><table class="table"><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr class="thead"><td class="align_left">Ground truth vs</td><td class="align_center">Appropriateness (%)</td><td class="align_center">Informativeness (%)</td><td class="align_center">Emotional (%)</td></tr><tr><td class="thead-hr" colspan="4"><hr/></td></tr><tr><td class="align_left">Text-based</td><td class="align_center">57.3</td><td class="align_center">69.3</td><td class="align_center">59.8</td></tr><tr><td class="align_left">Emotion-based</td><td class="align_center"><b>54.2</b></td><td class="align_center">62.7</td><td class="align_center">54.2</td></tr><tr><td class="align_left">Image-Chat</td><td class="align_center">58.2</td><td class="align_center">55.1</td><td class="align_center">52.8</td></tr><tr><td class="align_left">Ours-Emotion</td><td class="align_center">63.2</td><td class="align_center">61.8</td><td class="align_center">52.1</td></tr><tr><td class="align_left">Ours-Visual</td><td class="align_center">60.4</td><td class="align_center">60.5</td><td class="align_center">56.5</td></tr><tr><td class="align_left" colspan="4"><hr/></td></tr><tr><td class="align_left">Ours</td><td class="align_center">54.3</td><td class="align_center"><b>53.4</b></td><td class="align_center"><b>46.7</b></td></tr><tr class="table-tr"><td colspan="4"><hr class="tbody-hr"/></td></tr></table></td></tr><tr class="table-fn"><td><div>Bold values indicate the best results.<br/></div></td></tr></table>

<div>Manual annotation results of different methods (lower values indicating better models).</div>

International Journal of Intelligent Systems

tab2

Table 2

Table 2: Beyond Words: An Intelligent Human-Machine Dialogue System with Multimodal Generation and Emotional Comprehension