世界首个Mamba生产级模型Jamba发布；OpenAI推出语音引擎｜ AI头条

世界首个Mamba生产级模型Jamba发布；OpenAI推出语音引擎｜ AI头条

2024-12-26 10:58

整理 | 王轶群王启隆

出品 | AI 科技大本营（ID：rgznai100）

一分钟速览新闻点！

DeepMind：足够成本下，大语言模型幻觉不再是问题
消息称 Accel 领投的数据标注独角兽 Scale AI 估值接近 130 亿美元
AI 语音克隆公司 ElevenLabs 与 Rabbit AI 达成合作
开源应用 Podgenai：利用 GPT-4 AI 生成交互式信息播客
亚马逊云科技：AI 人才薪资增幅或超 33%
创新奇智发新模型 AInno-75B
百度升级 7 款大模型应用已全面 SaaS 化
Keep 在线 5000 节运动课程 15% 为 AIGC 生产

全球 AI 要闻

世界首个 Mamba 生产级模型 Jamba 发布，集成 Transformer 和 Mamba 两种架构

AI21 发布了世界首个 Mamba 的生产级模型：Jamba。这个模型采用了开创性的 SSM-Transformer 架构，具有 52B（520 亿）参数，其中 12B 在生成时处于活动状态。Jamba 结合了 Joint Attention 和 Mamba 技术，支持 256K 上下文长度。单个 A100 80GB 最多可容纳 140K 上下文。与 Mixtral 8x7B 相比，长上下文的吞吐量提高了 3 倍。

官网：https://top.aibase.com/tool/jamba

模型地址：https://huggingface.co/ai21labs/Jamba-v0.1

斯坦福大学和 DataBricks 团队合作开发 27B 生物医学语言模型 BioMedLM

斯坦福大学和 DataBricks 团队合作开发基于 GPT 风格的生物医学语言模型 BioMedLM，具有 27B 参数。该模型通过在生物医学领域的专业知识上训练，可以有效地回答有关医学和生物学的复杂问题。BioMedLM 已在 Hugging Face Hub 上公开发布，允许任何人下载并微调模型。

模型地址：https://huggingface.co/stanford-crfm/BioMedLM

OpenAI 推出语音引擎，可从 15 秒的样本中生成语音合成副本

据传，OpenAI 即将推出语音引擎，可以让用户从 15 秒的样本中生成语音的合成副本。该模型支持 OpenAI 的人工智能聊天机器人 ChatGPT 中的语音和“朗读”功能，以及 OpenAI 文本转语音 API 中提供的预设语音。这或许就是 Sam Altman 在先前访谈中透露的“今年即将发布的 GPT-5 以外的模型”。

OpenAI 的产品人员杰夫·哈里斯 (Jeff Harris) 表示：“该模型同时分析从中提取的语音数据和要大声朗读的文本数据，生成匹配的语音，而无需为每个说话者构建自定义模型。”

该模型可供包括 HeyGen 在内的约 100 个合作伙伴使用，Spotify 自 2023 年 9 月初以来一直在使用它为 Lex Fridman 等知名主持人用不同的语言配音播客。（TechCrunch）

微软推出 Azure AI 安全工具应对提示注入攻击

微软为 Azure AI 推出了一系列安全工具，旨在提高 AI 模型的安全性。这些工具包括 Prompt Shields 以防御提示注入攻击，Groundedness Detection 检测 AI 模型的虚构内容，AI 辅助安全评估以及风险和安全监控功能。专家表示，AI 模型的安全性问题仍未完全解决，需要警惕潜在的漏洞。

消息称微软和 OpenAI 正斥资 1000 亿美元打造 Stargate AI 超级计算机

据知情人士透露，微软和 OpenAI 的高管一直在制定一项数据中心项目计划，该项目将包含一台名为“Stargate”的美国超级计算机，配备数百万个专用服务器芯片，为 OpenAI 的人工智能提供动力。据一位曾与 OpenAI 首席执行官 Sam Altman 交谈过的人士以及一位看过微软部分初始成本估算的人士透露，该项目的成本可能高达 1000 亿美元。（The Information）

DeepMind：足够成本下，大语言模型幻觉不再是问题

谷歌 DeepMind 发表《大语言模型的长篇事实性》（Long-form factuality in large language models）论文，得出结论：只要付出足够成本，大语言模型幻觉将不再是问题。

大语言模型在响应开放式主题的 fact-seeking（事实寻求）提示时，通常会生成包含事实错误的内容，DeepMind 针对这一现象进行了一些探索性研究。

实证结果表明，LLM 智能体可以实现超越人类的评级性能。在一组约 16K 个单独的事实上，SAFE 在 72% 的情况下与人类注释者一致，且在 100 个分歧案例的随机子集上，SAFE 的赢率为 76%。同时，SAFE 的成本比人类注释者便宜 20 倍以上。研究者还使用 LongFact，对四个大模型系列（Gemini、GPT、Claude 和 PaLM-2）的 13 种流行的语言模型进行了基准测试，结果发现较大的语言模型通常可以实现更好的长篇事实性。

论文作者之一、谷歌研究科学家 Quoc V. Le 表示，这篇对长篇事实性进行评估和基准测试的新工作提出了一个新数据集、一种新评估方法以及一种兼顾精度和召回率的聚合指标。同时所有数据和代码将开源以供未来工作使用。

论文：https://arxiv.org/pdf/2403.18802.pdf

GitHub：https://github.com/google-deepmind/long-form-factuality

消息称 Accel 领投的数据标注独角兽 Scale AI 估值接近130亿美元

据直接知情人士透露，风险投资公司 Accel 是数据标签初创公司 Scale AI 的早期投资者，该公司正在就领投新一轮融资进行谈判，这将使该初创公司的估值提高近 80%，达到约 130 亿美元。

这项投资将使 Accel 能够维持这家有价值的初创公司的大部分股份，该初创公司对 OpenAI 和其他对话式 AI 初创公司销售服务的能力得到了提升。其中一位知情人士表示，为人工智能模型示记图像或文本的 Scale 正在洽谈本轮融资数亿美元。（The Information）

AI 语音克隆公司 ElevenLabs 与 Rabbit AI 达成合作

AI 语音克隆创企 ElevenLabs 宣布与 AI 硬件创企 Rabbit AI 达成合作。ElevenLabs 首席执行官 Mati Staniszewski 说：“我们的合作是为了让 R1 成为真正充满活力的副驾驶。”当 R1 用户通过语音执行高级命令时，ElevenLab 支持的语音将以真实的声音并保持低延迟进行回复。

开源应用 Podgenai：利用 GPT-4 AI 生成交互式信息播客

HackerNews 目前讨论一款开源软件 Podgenai，其利用先进的 GPT-4 大模型技术，可自动生成一小时长的信息音频播客。用户只需输入主题，程序将选择语音风格、列出相关子话题，并使用 LLM 生成对应文本及语音内容，再通过 ffmpeg 合并成完整的 mp3 文件。生成样例包括多种话题，如 PyTorch 教程、纽约城市介绍、比特币解析等。用户需提供 OpenAI API 密钥并承担生成费用（预计 2024 年每生成一次成本低于 2 美元）。

GitHub：https://github.com/impredicative/podgenai

亚马逊云科技：AI 人才薪资增幅或超 33%

亚马逊云科技发布最新研究表明，预计到 2028 年，AI 技术将在中国企业得到普遍应用。并且中国企业对 AI 人才非常重视，愿意为具备相关技能的人才提供平均高出 33% 的薪资。但目前具备 AI 技能的人才缺口巨大，企业在相关人才的招聘和培训方面都面临挑战。针对此，亚马逊云科技将在中国推出一系列 AI 知识培训课程，帮助企业和员工强化 AI 技术应用并有效提升生产力。

创新奇智发新模型 AInno-75B

创新奇智发布智孔明工业大模型 2.0 版本（AInno-75B）及多款大模型原生应用，奇智孔明工业大模型参数量达到 750 亿以上，增强了海量知识管理、复杂逻辑推理、长流程任务编排、Agent 智能体以及更多工业模态的生成能力。创新奇智在发布会上提到，在中国信通院可信 AI 工业大模型评测中，AInno-75B 于业内首家通过评测，且达到当前最高评级（4+级）；在 SuperCLUE 工业大模型基准评测中，奇智孔明工业大模型位列国内第 1 和卓越领导者象限。

百度升级 7 款大模型应用已全面 SaaS 化

百度智能云在“AICloud Day:大模型应用产品发布会”上，面向企业营销、对客服务、知识管理、数据洞察、代码编程等多个企业通用场景，升级数字人平台百度智能云曦灵、智能客服平台百度智能云客悦、内容创作平台“一念”、知识管理平台“甄知”、超级办公入口“超级助理”、生成式 BI 产品“百度 GBI”，以及代码助手“Baidu Comate” 7 大产品。本次百度智能云升级的 7 大产品已实现全面 SaaS 化，企业在网页端即可使用。

Keep 在线 5000 节运动课程 15% 为 AIGC 生产

据 Keep 联合创始人彭唯透露，Keep 在线有 5000 节官方运动课程，其中 15% 为 AIGC 生产。他表示今年 Keep 将会继续投入 AI 资源，提升这一比例，包括在专业课程方向和运动数据方向同时发力，引入算法能力以提升专业度，并上线运动评估体系，基于运动科学、运动数据和算法来帮助用户感知身体状态和运动能力的变化。运动评估体系还可以在无心率设备下，每天为 100 万运动用户预估运动负荷、最大摄氧量、FTP 等数据。目前，该体系已服务 1500 万用户。（第一财经）

4 月 25 ~ 26 日，由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「全球机器学习技术大会」将在上海环球港凯悦酒店举行，特邀近 50 位技术领袖和行业应用专家，与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众，共同探讨人工智能领域的前沿发展和行业最佳实践。欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫码进一步了解详情。