当前位置：网站首页 AI教程资讯正文

iPhone的AI时刻不远了？苹果Ferret多模态大模型登场

来源：互联网发布时间：2025-07-18

今年10月，作为苹果公司与哥伦比亚大学的研究成果，Ferret就已经发布过一次，只是当时仅供研究使用而非商业许可，所以并未引起多大关注。如今情况发生了转变，随着各大科技公司你追我赶地公布研发成果，关于本地模型为小型设备提供智能体验的讨论也越来越多。

12月以来，苹果也陆续公布它在AI领域的研发进展。12月初苹果公布AppleSilicon平台专用AI框架MLX、以及能在设备端执行大语言模型的方法，后者能在边缘设备上执行DRAM两倍大的模型，可节省执行大模型所需的运算资源，也更能确保隐私安全。

上周，苹果再次公布全新成果——Ferret大语言模型以及相关标竿测试工具与数据集。

作为一款多模态模型，Ferret可以接受文字、声音、影像或数据的输入。根据苹果10月公布Ferret的研究论文，Ferret能理解任何形状或任何图片颗粒（granularity），并且可以准确定位（ground）开放词汇的描述。为了把引用（refer）和定位能力整合到模型中，Ferret采用一种混合区域表征（hybridregionrepresentation）技术，整合个别方位和连续性的特征，以表示图片中的某一区域。为提取出区域中的连续特征，苹果研究人员提出一种空间感知的视觉采样器，它能处理不同形状多种稀疏性。这也使Ferret可以接受多样化区域输入，像是点、边界框、自由形式的形状。

为提升Ferret的能力，苹果团队使用了GRIT数据集（Ground-and-ReferInstruction-Tuning），后者为是一个广大的refer-and-ground指令微调数据集，包含110万个样本，内有丰富的阶层化空间知识，以及9.5万个负样本，以提升模型的判断力。

与Kosmos-2、GPT4-ROI、LLaVA、Shikra等多模态大语言模型比较，最后苹果得到的模型Ferret-13B，在传统引用及定位任务具有优异效能，此外，在区域为基础、需要本地化的多模态对话、细节描述，以及复杂推理等任务上，Ferret-13B的表现同样优于其他模型。在视觉化比较任务，苹果说它的模型展现优异的空间理解及常识推理能力。此外，苹果宣称其物件幻觉也较Shikra、InstructBLIP、MiniGPT4、LLaVA、MM-GPT及mPLUG-Owl等知名模型少很多。

苹果公布了Ferret7B、130B二模型的代码、GRIT数据集、标竿测试工具Ferret-Bench，上周也公布了Ferret70B及130B检查点（checkpoint）。

有趣的是，在人工智能社区中，很多人都是到最近才发现苹果的大模型，BartdeWitte也在X上感叹自己居然错过了这个消息，同时也表示：“期待着有一天，本地大型语言模型能作为重新设计的iOS的集成服务，运行在我的iPhone上。”

随着苹果大模型的开发有了新的进展，Anthropic和OpenAI据称也在为其专有大语言模型的开发工作谈判新的巨额融资。

相关信息

iPhone的AI时刻不远了？苹果Ferret多模态大模型登场今年10月，作为苹果公司与哥伦比亚大学的研究成果，Ferret就已经发布过一次，只是当时仅供研究使用而非商业许可，所以并未引起多大关注。如今情况发生了转变，随着各大科技公司你追我赶地公布研发成果，关于本地
AI教程资讯 07-18
金融风控新范式！腾讯云李超谈大模型如何进入金融核心业务作为数据密集型行业，金融业是大模型应用落地的最优场景之一，大模型应用如何直击金融业务“最后一公里”？近日，南方都市报、南都大数据研究院联合琶洲实验室、光明实验室在广州举办“势起AI 智启新界”大模型创新应
AI教程资讯 07-18
AI大模型在金融领域陆续落地，专家建议强化跨平台、跨市场监管随着全国首个官方“大模型标准符合性测试”结果公布，AI大模型商业化应用的关注度进一步提升。在金融领域，AI大模型被不少业内人士视为第二次数字化浪潮，是金融科技向智能金融的进阶升级。但目前来看，智能金融的
AI教程资讯 07-18

推荐AI教程资讯

小编推荐 +

PromptPerfect

类型：AI工具浏览器
查看
Wisdom AI-AI超级工作流

类型：AI工具浏览器
查看
笔魂AI绘画

类型：AI工具浏览器
查看
GPTKit

类型：AI工具浏览器
查看
腾讯混元生图

类型：AI工具浏览器
查看

近期热点 +

AI教程资讯周排行 +

07-18

iPhone的AI时刻不远了？苹果Ferret多模态大模型登场今年10月，作为苹果公司与哥伦比亚大学的研究成果，Ferret就已经发布过一次，只是当时仅供研究使用而非商业许可，所以并未引起多大关注。如今情况发生了转变，随着各大科技公司你追我赶地公布研发成果，关于本地
07-18

金融风控新范式！腾讯云李超谈大模型如何进入金融核心业务作为数据密集型行业，金融业是大模型应用落地的最优场景之一，大模型应用如何直击金融业务“最后一公里”？近日，南方都市报、南都大数据研究院联合琶洲实验室、光明实验室在广州举办“势起AI 智启新界”大模型创新应
07-18

AI大模型在金融领域陆续落地，专家建议强化跨平台、跨市场监管随着全国首个官方“大模型标准符合性测试”结果公布，AI大模型商业化应用的关注度进一步提升。在金融领域，AI大模型被不少业内人士视为第二次数字化浪潮，是金融科技向智能金融的进阶升级。但目前来看，智能金融的
07-18

AI大模型的商业狂响：细数18张“潜力拼图” 一文拆解“AI大模型”的18张商业潜力图谱大戏开始前，一片漆黑，当一抹边角被光线撕开，盛装演出的大幕也就将启了。直至AI大模型ChatGPT向认知智能突破之前，AI的前景还一度“万古如长夜”，如无出意外，以ChatGPT、Gemini、文心一言等为代表的AI大模型
07-18

阿里云诠释“通义听悟”：AI大模型化身工作生活好帮手如果你是一名职场人，通义听悟可以帮你记录和回顾你的每一场会议；如果你是一位学生，通义听悟可以让你不遗漏老师讲授的每一个重点；如果你是一名金融分析师或媒体从业人员，通义听悟可以存档你每一次的调研访谈