小米的手机不能用whatsapp
)8月8日,汉王科技2024新品发布会圆满举行,致力于让所有人都可以无障碍地进行语言记录、交流沟通的首款智能语音应用——汉王语音王APP发布。
据介绍,汉王语音王是基于汉王自研多模态天地大模型,自主研发的一款集AI语音记录、智能翻译与同声传译于一体的智能语音旗舰应用,支持AI精准转写、拍录同步(自动裁边)、话稿整理、智能总结及不间断实时翻译等功能,用户可以即听即用,帮助跨越语言障碍,提高日常办公、学习、会议小米的手机不能用whatsapp、旅游等场景的应用效率和便捷性。
语音记录精准识别拍录同步。汉王语音王支持实时语音转录和语音文件转录两种方式,具备录音速记、拍录同步(自动裁边)、语音转文字、说话人精准识别、智能总结、AI话稿整理等多种智能功能。汉王科技自研高精度语音识别模型,具备高准确率、多语言支持、动态修正和自然交流等特点。在行业广泛使用的开源中文语音识别数据集上测试,错误率低至1.94%,处于领先水平。
汉王语音王可以自动修正错误文本,内容规整后无须二次编辑,还支持自动生成标题、总结记录要点等。拍录同步功能则是在录音转写的同时拍照,通过强大的原研OCR技术,在录音类产品中首创照片自动裁边和内容智能排版功能,为用户直接提供一份声、图、文并茂的多媒体记录文档。
在会议、头脑风暴等多人对话场景中,准确分离出每个人的身份以及内容具有极大挑战,声纹识别成为关键。汉王科技声纹识别技术具备在不限定用户说线秒准确识别说话人的能力。汉王科技解决了场景中的各种环境噪声和回响,以及说话人语速和情感变化等复杂情况下的识别准确性问题,在复杂场景下能够提供稳定的准确识别率。同时,引入聚类算法等实现了结合声纹和语义特征,进一步提高识别的准确性。
当整理好会议纪要、演讲内容等后,汉王语音王能与电纸本一键分享,将语音文本一体化传输到电纸本上进行高效阅读办公操作,实现多端互联、共享的应用生态。
对话翻译即时捕捉自然准确。具备实时翻译和语音合成两大能力,可以精准捕捉每一句对话,即时翻译,让大家可以跨越语言界限,适合办公、教育和旅游等场景下无障碍交流沟通。
基于汉王自研天地大模型的对话翻译,具备更好的语义理解和上下文联系能力,以及自适应语言风格和行业领域,提供更准确和自然的翻译内容,表达更清楚、交流更顺畅。汉王科技自研的语音合成系统不仅具有卓越的多音字准确识别能力,还能处理各种复杂多变的语音现象。汉王科技自研高自然度声学模型,并引入了恒Q变换等多项先进技术,让合成语音能更加高效和精准地还原人类语音特性。
汉王语音王同声传译功能具备长时段不间断即时翻译能力,实时双语对照文字记录,更能准确表达专业术语和词句表达。加上配录同步功能,跨越语言的障碍,帮助用户轻松解决超长时间国际会议、学术研讨的内容记录难题。