AI 总结
谷歌新推出的Gemini模型登顶大型语言模型(LLM)排行榜,超越了OpenAI的GPT-4和GPT-4 Turbo推理模型。埃隆·马斯克的xAI正在筹集高达60亿美元资金,计划购买10万块英伟达芯片用于孟菲斯数据中心。法国初创公司Mistral发布了Pixtral Large模型,同时升级了聊天机器人Le Chat,直接与OpenAI的ChatGPT竞争。其他重要新闻包括微软推出适应性AI模型、OpenAI即将推出AI代理工具,以及DeepL推出实时语音翻译解决方案。
以下全文
谷歌新推出的Gemini模型直接登顶大型语言模型排行榜
谷歌最新的人工智能模型Gemini-Exp-1114在Imarena聊天机器人竞技场排行榜上名列第一,超越了OpenAI的GPT-4和GPT-4 Turbo推理模型。这个排行榜(前身为LMSys竞技场)让AI实验室在盲测竞争中展示他们的模型,用户在不知道具体模型身份的情况下进行投票。由谷歌DeepMind开发的Gemini-Exp-1114模型在数学和视觉任务方面表现尤为出色。尽管取得了成功,该模型目前仅通过免费的谷歌AI Studio账户提供访问,尚未在Gemini应用程序或网站上公开。目前尚不清楚该模型是否为Gemini 1.5的一个版本,或是对预期中的Gemini 2能力的早期展示。
埃隆·马斯克的xAI筹集高达60亿美元以购买10万个英伟达芯片用于孟菲斯数据中心
据报道,埃隆·马斯克的人工智能公司xAI正以500亿美元的估值筹集高达60亿美元的资金,用于收购10万块英伟达芯片,以在孟菲斯建立一台新的超级计算机。这笔资金预计将于下周完成,其中50亿美元来自中东主权基金,另外10亿美元来自其他投资者。马斯克于2023年创立的xAI公司在去年11月发布了名为Grok的聊天机器人,旨在与OpenAI、谷歌的Bard以及Anthropic的Claude等其他AI公司竞争。与此同时,马斯克还在积极与当选总统唐纳德·特朗普的新ZF合作,探讨人工智能和技术方面的政策。
Mistral发布Pixtral Large,并将Le Chat升级为全面竞争ChatGPT的产品
法国初创公司Mistral推出了Pixtral Large,这是一个拥有1240亿参数的模型,同时升级了其聊天机器人Le Chat,直接挑战OpenAI的ChatGPT。Pixtral Large作为一款开源的多模态人工智能,在文本和视觉数据处理方面表现卓越,每次输入可处理多达30张高分辨率图像或一本300页的书籍。该模型在各种基准测试中表现出色,特别适用于图表解读、文档分析和图像理解等任务。由Pixtral Large驱动的Le Chat现已增添多项新功能,包括带引用的网络搜索、创意画布、高级文档和图像分析、图像生成,以及用于自动化的任务代理。尽管取得了这些进展,Mistral的模型和在大型企业中的API使用率仍落后于OpenAI、Anthropic和微软等美国公司。
Codeium推出Windsurf编辑器:一款代理式集成开发环境
Codeium的Windsurf Editor融合了AI协作和自主任务处理,打造出流畅的开发体验。其创新的Cascade功能结合了深度代码库理解和实时开发者互动,显著提升了生产力。
微软推出面向行业的新型自适应AI模型
微软正与行业伙伴合作,开发针对特定行业需求的AI模型。这些模型可通过Azure AI模型目录获取,旨在提升各行业的商业成果和创新能力。
OpenAI即将推出AI代理工具,实现用户任务自动化
OpenAI即将推出的AI代理(代号"Operator")旨在为用户自主执行编码和旅行预订等任务。
Cerebras借助Meta的Llama 3.1 405B模型实现突破性性能
Cerebras Systems在AI推理领域取得重大突破。使用Meta的Llama 3.1 405B模型,它创下了每秒969个标记的新性能记录,实现了实时响应。这一成就比传统的GPU解决方案快了多达75倍。
谷歌的Gemini聊天机器人现已具备记忆功能
谷歌的Gemini聊天机器人新增了记忆功能,能够记住用户的偏好和信息,从而实现个性化互动。该功能现已向Google One AI Premium订阅用户开放,但不会用于模型训练。
DeepL推出语言AI新前沿:语音翻译解决方案DeepL Voice
DeepL Voice引入了会议和对话的实时语音翻译功能,扩展了DeepL的语言AI能力。这一创新使口头交流能够实现高准确性和安全性的多语言互动。
Forge Reasoning API Beta和Nous Chat:LLM推理的革新
Nous Research推出了Forge Reasoning API Beta和Nous Chat。这些工具通过蒙特卡洛树搜索、代码链和代理混合等先进架构,增强了语言模型的推理能力。用户现可利用多个模型进行多样化和复杂的AI交互。
Ignite 2024为Microsoft 365 Copilot引入新AI代理和更多功能
微软Ignite 2024发布了一系列新的AI代理和Microsoft 365 Copilot的增强功能。这些创新旨在通过自动化、协作和组织工具提高工作场所的效率。
ElevenLabs现可构建对话式AI代理
ElevenLabs推出了一个平台,用于构建可定制的对话式AI代理。用户可以整合自己的知识库,从各种语言模型中选择,同时利用其现有的文本转语音功能。
中国AI初创公司推出图像转视频工具,挑战OpenAI的Sora
盛书科技的Vidu工具通过整合多张图像,实现了视觉连贯的视频创作,直接与OpenAI的Sora展开竞争。
Perplexity为美国专业用户推出购物功能
Perplexity在美国为专业用户推出的新购物功能将AI驱动的搜索与电子商务相结合。它提供无偏见的产品推荐、一键结账和商家计划,旨在提升用户体验,并与谷歌和亚马逊等主要竞争对手一较高下。
Suno V4 AI音乐生成器发布,成果令人印象深刻
Suno V4在AI音乐生成方面取得了显著进步,包括改进的音频质量、动态歌曲结构,以及像ReMi歌词助手这样的创新功能,大大增强了用户的创作可能性。
Figure 02在宝马生产线上速度提升四倍
Figure AI的人形机器人Figure 02在宝马生产线上实现了400%的速度提升和七倍的成功率提高。该公司计划在2025年前进一步部署和增强这一技术。
Fastino推出任务优化的LLM:比领先模型快1000倍,无需GPU
Fastino推出了任务优化的语言模型,其运行速度比使用CPU或NPU的传统模型快1000倍。这一创新减少了对GPU的需求,同时提高了企业人工智能应用的准确性、速度和安全性。
微软的Copilot面临挑战
微软的人工智能产品Copilot正面临重大挑战,包括客户不满、安全问题和内部怀疑。与此同时,竞争对手正利用微软的困境,而公司也在努力证明其在人工智能方面的巨额投资是合理的。
Nvidia推迟推出的Blackwell人工智能芯片因服务器过热问题受阻
Nvidia的Blackwell GPU最初因服务器机架过热问题而推迟推出。尽管这个问题可能已经得到解决,但人工智能数据中心的能源和热量管理仍面临巨大挑战。
马斯克修订对OpenAI的诉讼,将微软列为被告
埃隆·马斯克对OpenAI重新提起的诉讼现将微软和其他方列为被告。诉讼指控他们违反反垄断法和从事垄断行为,同时指责OpenAI放弃其非营利使命,并不公平地从微软的资源中获益。
筹集2.2亿美元的AI初创公司H推出首款产品:用于"代理"应用的Runner H
总部位于巴黎的AI初创公司H推出了其首款产品Runner H。这是一款"代理型"AI,旨在执行机器人流程自动化和质量保证等任务。Runner H基于一个拥有20亿参数的专有紧凑型大语言模型。该公司正在筹集A轮融资以进一步推动其开发,同时准备向开发者发布API。
Nuro转向授权自动驾驶技术,同时扩大无人驾驶测试
Nuro正将其无人驾驶车辆测试扩展到新地区和更复杂的环境。这是该公司将自主技术授权给汽车制造商和出行运营商的战略转变的一部分。
Sam Altman将共同主持旧金山当选市长丹尼尔·卢里的过渡团队
OpenAI首席执行官Sam Altman将与旧金山当选市长丹尼尔·卢里共同主持过渡团队。Altman将帮助该市推动创新并加强与科技行业的联系。卢里的目标是解决公共安全问题并留住该地区的科技企业家。
麻省理工学院研究人员提出Boltz-1:第一个在生物分子结构预测中达到AlphaFold3级别准确性的开源AI模型
Boltz-1,由麻省理工学院的研究人员开发,是一个开源AI模型,其在预测生物分子结构方面的准确性与AlphaFold3相当,提供了新的MSA配对算法和统一裁剪方法等创新,以提高准确性并减少计算需求,从而使先进的生物分子建模更加普及。
Pleias发布最大的多语言开放预训练数据集
Pleias发布了Common Corpus,这是用于训练大型语言模型的最大开放多语言数据集,包含超过2万亿个许可内容的标记,涵盖多种语言和领域,旨在平衡开放性和性能,同时解决数据质量和合规性挑战。
人工智能聊天机器人在疾病诊断方面击败了医生
ChatGPT-4 在诊断医疗状况方面超越了医生,突显了聊天机器人的卓越准确性以及医生对自己诊断的潜在过度自信。
LLaVA-o1:让视觉语言模型逐步推理
LLaVA-o1是一种新型的视觉-语言模型,通过自主进行多阶段推理和利用新数据集及推理时间缩放方法,提高了在推理密集型任务中的精确度。
AnimateAnything: 一致且可控的视频生成动画
AnimateAnything引入了一种新颖的视频生成方法,该方法使用多尺度控制特征融合网络和基于频率的稳定模块,以在各种条件下实现精确、一致且无闪烁的动画。
人工智能正在取代我们的工作:事实还是炒作?
生成式AI工具如ChatGPT正在迅速减少自动化领域的就业机会。然而,那些主动学习AI技能的人可能会在不断演变的就业市场中发现新的机遇。
GEMA对OpenAI提起歌词版权诉讼,开创版权组织先例
德国音乐版权协会GEMA对OpenAI提起诉讼,指控其未经授权使用歌词。此举旨在明确版权法适用范围,并为生成式AI系统建立许可框架。
AI生成的埃隆·马斯克虚假信息在Facebook上迅速传播
AI生成的虚假信息将埃隆·马斯克描绘成一位善解人意的问题解决者。这些信息在Facebook等平台上广泛传播,背后是一群试图通过互动获利的垃圾信息发送者。他们利用公众对美国总统选举等热点事件的关注来吸引眼球。
本周刊在微信公众号“鼠部落”首发,每周更新,欢迎您关注、点赞、转发!