
尊龙凯时体育还同期具备图片、音频、文本三种模态数据处理身手-尊龙凯时人生就是博·「中国」官方网站
新闻习作
新浪科技讯 12月16日下昼音讯,无问芯穹晓谕开源端上智能一体化惩办决策中的小模子——端侧全模态相识模子Megrez-3B-Omni,并同步开源了纯言语版块模子Megrez-3B-Instruct。 据先容,Megrez-3B-Omni遴选了最适捏机、平板等端侧建设的30亿参数黄金尺寸,结构规整,推理速率最高最初同精度模子300%。此外,还同期具备图片、音频、文本三种模态数据处理身手,且在三个模态的多种测评基准中获取最优性能。 在图像相识方面,Megrez-3B-Omni诚然体积仅为3B,但概
详情
新浪科技讯 12月16日下昼音讯,无问芯穹晓谕开源端上智能一体化惩办决策中的小模子——端侧全模态相识模子Megrez-3B-Omni,并同步开源了纯言语版块模子Megrez-3B-Instruct。
据先容,Megrez-3B-Omni遴选了最适捏机、平板等端侧建设的30亿参数黄金尺寸,结构规整,推理速率最高最初同精度模子300%。此外,还同期具备图片、音频、文本三种模态数据处理身手,且在三个模态的多种测评基准中获取最优性能。
在图像相识方面,Megrez-3B-Omni诚然体积仅为3B,但概述性能不错跨越34B的LLaVA-NeXT-Yi-34B模子,是当今OpenCompass、MME、MMMU、OCRBench等多个主流测试集上精度最高的图像相识模子之一。
在语音相识方面,Megrez-3B-Omni 不仅撑持中、英文语音输入,还能处理复杂的多轮对话场景,撑持对输入图片或翰墨的语音发问,终了不同模态间的目田切换。
在文要津会方面,Megrez-3B-Omni在莫得就义模子文本处理身手情况下,将上一代14B大模子的身手压缩至3B规模,显贵裁减了谋划老本、擢升了谋划着力。在C-EVAL、MMLU/MMLU Pro、AlignBench等多个巨擘测试集上,获取端上模子最优精度。
据悉,当今Megrez-3B-Omni处于身手预览阶段,接下来无问芯穹将接续迭代Megrez系列,擢升自动化水平至“edge device use”后果,让用户只需要给出简便的语音教导,就可完成端侧建设竖立或诓骗操作。(文猛)


株连裁剪:王若云 尊龙凯时体育