OpenAI发布强化微调却被马斯克的xAI、Meta抢走风头

专题：OpenAI开启12天狂欢

　　财联社12月7日讯（编辑史正丞）就在OpenAI的“12日大直播”进入第二天之际，马斯克和扎克伯格同时出手，争抢市场的注意力。

　　在进入正题前，先简要介绍一下OpenAI第二日直播发布的产品：强化微调（Reinforcement Finetuning）。这是一种旨在特定领域使用非常少的训练数据，就能在o1等模型的基础上创造专家模型的功能。例如OpenAI正在与汤森路透合作，打造专属于该公司的法律专业模型。

　　OpenAI在演示中表示，经过强化微调后，哪怕是基于o1-mini的专属模型，在应对特定任务时的表现，也会比通用o1模型的表现更好。公司介绍称，这个项目适合那些执行“由专家主导狭窄、复杂任务的机构”，例如金融、法律、医疗、工程等领域都有可能获益。

　　目前开发人员需要通过申请获得强化微调alpha项目的访问权限，公司期待在2025年初公开提供这项服务。

　　很显然，OpenAI的新品应该会令那些有训练模型需求的程序员们感到激动，但大多数“坐等现成产品”的消费者恐怕就没什么感觉了。

　　就在这个时候，马斯克的xAI和Meta公司出手了。

　　Grok聊天机器人对所有用户开放

　　不少马斯克旗下社交媒体平台X的用户发现，从周五开始，不加钱订阅会员的用户也能使用Grok聊天机器人了。

　　Grok由xAI去年推出，在今年8月增加了“文生图”功能。与公司老板马斯克一样，这个AI产品也非常特立独行——Grok应该是目前主流大公司的AI产品里，唯一一个没有设置严格安全护栏的聊天机器人，例如用户可以生成特朗普这种知名公众人物的AI图像。

　　根据报道，没有给马斯克付钱的用户，每两小时可以向Grok发送10条信息。更关键的问题是，随着这款颇具争议的产品面向上亿用户免费开放，未来在互联网上分辨图片真实性的难度料将显著提升。

　　xAI本周向美国证券交易委员会提交报告，披露完成了一笔60亿美元的融资，公司的估值已经超过400亿美元。

　　Meta发布Llama家族新成员

　　在开源AI赛道上领跑的Meta公司周五宣布，推出Llama 3.3 70B模型。目前开发者们已经可以从Llama官网或“抱抱脸”等代码平台上下载。

　　Meta的生成式AI副总裁Ahmad Al-Dahle表示，纯文本的Llama 3.3 70B能够以更低的成本，提供与Llama家族最大模型Llama 3.1 405B相当的性能水平。利用最新的后训练（Post-Training）技术进展，该模型在显著降低成本的同时提高了核心性能。

　　Al-Dahle也发布了一张侧视图，显示Llama 3.3 70B模型在多个基准测试中表现优于谷歌的Gemini 1.5 Pro、OpenAI的GPT-4o，以及亚马逊的Nova Pro，而且在成本上还有很大优势。

　　为了参与这场AI时代的竞争，Meta本周刚宣布将斥资100亿美元在路易斯安那州建设公司历史上最大的人工智能数据中心。扎克伯格此前曾表示，为了训练下一代Llama模型Llama 4，公司需要的计算能力是训练Llama 3所需的10倍。

还没有评论，来说两句吧...