专题:OpenAI开启12天狂欢
财联社12月7日讯(编辑 史正丞)就在OpenAI的“12日大直播”进入第二天之际,马斯克和扎克伯格同时出手,争抢市场的注意力。
在进入正题前,先简要介绍一下OpenAI第二日直播发布的产品:强化微调(Reinforcement Finetuning)。这是一种旨在特定领域使用非常少的训练数据,就能在o1等模型的基础上创造专家模型的功能。例如OpenAI正在与汤森路透合作,打造专属于该公司的法律专业模型。
OpenAI在演示中表示,经过强化微调后,哪怕是基于o1-mini的专属模型,在应对特定任务时的表现,也会比通用o1模型的表现更好。公司介绍称,这个项目适合那些执行“由专家主导狭窄、复杂任务的机构”,例如金融、法律、医疗、工程等领域都有可能获益。
目前开发人员需要通过申请获得强化微调alpha项目的访问权限,公司期待在2025年初公开提供这项服务。
很显然,OpenAI的新品应该会令那些有训练模型需求的程序员们感到激动,但大多数“坐等现成产品”的消费者恐怕就没什么感觉了。
就在这个时候,马斯克的xAI和Meta公司出手了。
Grok聊天机器人对所有用户开放
不少马斯克旗下社交媒体平台X的用户发现,从周五开始,不加钱订阅会员的用户也能使用Grok聊天机器人了。
Grok由xAI去年推出,在今年8月增加了“文生图”功能。与公司老板马斯克一样,这个AI产品也非常特立独行——Grok应该是目前主流大公司的AI产品里,唯一一个没有设置严格安全护栏的聊天机器人,例如用户可以生成特朗普这种知名公众人物的AI图像。
根据报道,没有给马斯克付钱的用户,每两小时可以向Grok发送10条信息。更关键的问题是,随着这款颇具争议的产品面向上亿用户免费开放,未来在互联网上分辨图片真实性的难度料将显著提升。
xAI本周向美国证券交易委员会提交报告,披露完成了一笔60亿美元的融资,公司的估值已经超过400亿美元。
Meta发布Llama家族新成员
在开源AI赛道上领跑的Meta公司周五宣布,推出Llama 3.3 70B模型。目前开发者们已经可以从Llama官网或“抱抱脸”等代码平台上下载。
Meta的生成式AI副总裁Ahmad Al-Dahle表示,纯文本的Llama 3.3 70B能够以更低的成本,提供与Llama家族最大模型Llama 3.1 405B相当的性能水平。利用最新的后训练(Post-Training)技术进展,该模型在显著降低成本的同时提高了核心性能。
Al-Dahle也发布了一张侧视图,显示Llama 3.3 70B模型在多个基准测试中表现优于谷歌的Gemini 1.5 Pro、OpenAI的GPT-4o,以及亚马逊的Nova Pro,而且在成本上还有很大优势。
为了参与这场AI时代的竞争,Meta本周刚宣布将斥资100亿美元在路易斯安那州建设公司历史上最大的人工智能数据中心。扎克伯格此前曾表示,为了训练下一代Llama模型Llama 4,公司需要的计算能力是训练Llama 3所需的10倍。
还没有评论,来说两句吧...