你的位置:尊龙凯时人生就是博·「中国」官方网站 > 新闻习作 > 尊龙凯时体育还同期具备图片、音频、文本三种模态数据处理身手-尊龙凯时人生就是博·「中国」官方网站

尊龙凯时体育还同期具备图片、音频、文本三种模态数据处理身手-尊龙凯时人生就是博·「中国」官方网站

发布日期:2025-06-06 01:33    点击次数:140

新闻习作

新浪科技讯 12月16日下昼音讯,无问芯穹晓谕开源端上智能一体化惩办决策中的小模子——端侧全模态相识模子Megrez-3B-Omni,并同步开源了纯言语版块模子Megrez-3B-Instruct。 据先容,Megrez-3B-Omni遴选了最适捏机、平板等端侧建设的30亿参数黄金尺寸,结构规整,推理速率最高最初同精度模子300%。此外,还同期具备图片、音频、文本三种模态数据处理身手,且在三个模态的多种测评基准中获取最优性能。 在图像相识方面,Megrez-3B-Omni诚然体积仅为3B,但概

详情

尊龙凯时体育还同期具备图片、音频、文本三种模态数据处理身手-尊龙凯时人生就是博·「中国」官方网站

  新浪科技讯 12月16日下昼音讯,无问芯穹晓谕开源端上智能一体化惩办决策中的小模子——端侧全模态相识模子Megrez-3B-Omni,并同步开源了纯言语版块模子Megrez-3B-Instruct。

  据先容,Megrez-3B-Omni遴选了最适捏机、平板等端侧建设的30亿参数黄金尺寸,结构规整,推理速率最高最初同精度模子300%。此外,还同期具备图片、音频、文本三种模态数据处理身手,且在三个模态的多种测评基准中获取最优性能。

  在图像相识方面,Megrez-3B-Omni诚然体积仅为3B,但概述性能不错跨越34B的LLaVA-NeXT-Yi-34B模子,是当今OpenCompass、MME、MMMU、OCRBench等多个主流测试集上精度最高的图像相识模子之一。

  在语音相识方面,Megrez-3B-Omni 不仅撑持中、英文语音输入,还能处理复杂的多轮对话场景,撑持对输入图片或翰墨的语音发问,终了不同模态间的目田切换。

  在文要津会方面,Megrez-3B-Omni在莫得就义模子文本处理身手情况下,将上一代14B大模子的身手压缩至3B规模,显贵裁减了谋划老本、擢升了谋划着力。在C-EVAL、MMLU/MMLU Pro、AlignBench等多个巨擘测试集上,获取端上模子最优精度。

  据悉,当今Megrez-3B-Omni处于身手预览阶段,接下来无问芯穹将接续迭代Megrez系列,擢升自动化水平至“edge device use”后果,让用户只需要给出简便的语音教导,就可完成端侧建设竖立或诓骗操作。(文猛)

海量资讯、精确解读,尽在新浪财经APP

株连裁剪:王若云 尊龙凯时体育

www.wtan.xyz

官方网站

关注我们

新闻习作商贸科技园6088号

联系地址

Powered by 尊龙凯时人生就是博·「中国」官方网站 RSS地图 HTML地图


尊龙凯时人生就是博·「中国」官方网站-尊龙凯时体育还同期具备图片、音频、文本三种模态数据处理身手-尊龙凯时人生就是博·「中国」官方网站