Figure/Table detail

应用领域与场景技术类型典型案例
智慧教育:提供沉浸式的学习体验,融合视觉、听觉和文本来提高学习效果多模态教学系统Coursera的多模态学习系统;Edmodo的AI辅助教学平台;好未来的智能课堂
医疗:帮助医生通过图像和语音进行患者健康评估多模态医疗诊断微软的Healthcare NExT;科大讯飞的智慧医疗;拜耳的多模态诊断系统
自动驾驶:利用摄像头、雷达和语音数据进行环境感知和决策多模态感知系统Tesla的自动驾驶系统;Waymo的自动驾驶平台;百度的Apollo技术
娱乐:结合视觉、语音和动作捕捉,提供更沉浸的游戏体验多模态互动娱乐系统索尼的PlayStation VR;Meta的Horizon Worlds;Valve Index的VR游戏体验
电商:通过图像、语音和文本分析消费者行为,提供个性化推荐多模态推荐系统亚马逊的Alexa购物助手;阿里巴巴的达摩院多模态推荐引擎;京东的AI推荐
智慧金融:结合不同类型的数据进行风险评估和欺诈检测多模态风控与评估系统平安银行的多模态风控系统;Visa的AI风控平台;摩根大通的金融监控系统
智能家居:通过语音、图像和手势识别来控制智能设备多模态智能家居控制系统谷歌Nest的多模态交互平台;小米的AIoT智能家居;亚马逊的Echo Show
智能客服:利用语音、文本和表情识别为用户提供智能服务多模态智能客服系统阿里巴巴的“阿里小蜜”;京东的“京小智”;腾讯的智能客服
医疗培训:通过虚拟环境结合图像、语音和触觉反馈进行培训多模态医疗培训系统强生的虚拟培训平台;达芬奇机器人的手术培训系统;迈瑞的虚拟培训
安防:通过监控视频、语音和行为分析实现全面的安全监控多模态安防系统华为的智慧安防平台;海康威视的AI安防系统;大华股份的多模态监控技术
Table 1 Key application areas and scenarios for multimodal learning technologies
Other figure/table from this article