分享好友 最新动态首页 最新动态分类 切换频道
世界首个Mamba生产级模型Jamba发布;OpenAI推出语音引擎 | AI头条
2024-12-26 10:58

整理 | 王轶群  王启隆

世界首个Mamba生产级模型Jamba发布;OpenAI推出语音引擎 | AI头条

出品 | AI 科技大本营(ID:rgznai100

一分钟速览新闻点

  • DeepMind:足够成本下,大语言模型幻觉不再是问题

  • 消息称 Accel 领投的数据标注独角兽 Scale AI 估值接近 130 亿美元

  • AI 语音克隆公司 ElevenLabs 与 Rabbit AI 达成合作

  • 开源应用 Podgenai:利用 GPT-4 AI 生成交互式信息播客

  • 亚马逊云科技:AI 人才薪资增幅或超 33%

  • 创新奇智发新模型 AInno-75B

  • 百度升级 7 款大模型应用 已全面 SaaS 化

  • Keep 在线 5000 节运动课程 15% 为 AIGC 生产

全球 AI 要闻

世界首个 Mamba 生产级模型 Jamba 发布,集成 Transformer 和 Mamba 两种架构

AI21 发布了世界首个 Mamba 的生产级模型:Jamba。这个模型采用了开创性的 SSM-Transformer 架构,具有 52B(520 亿)参数,其中 12B 在生成时处于活动状态。Jamba 结合了 Joint Attention 和 Mamba 技术,支持 256K 上下文长度。单个 A100 80GB 最多可容纳 140K 上下文。与 Mixtral 8x7B 相比,长上下文的吞吐量提高了 3 倍。

官网https://top.aibase.com/tool/jamba

模型地址https://huggingface.co/ai21labs/Jamba-v0.1

斯坦福大学和 DataBricks 团队合作开发 27B 生物医学语言模型 BioMedLM

斯坦福大学和 DataBricks 团队合作开发基于 GPT 风格的生物医学语言模型 BioMedLM,具有 27B 参数。该模型通过在生物医学领域的专业知识上训练,可以有效地回答有关医学和生物学的复杂问题。BioMedLM 已在 Hugging Face Hub 上公开发布,允许任何人下载并微调模型。

模型地址https://huggingface.co/stanford-crfm/BioMedLM

OpenAI 推出语音引擎,可从 15 秒的样本中生成语音合成副本

据传,OpenAI 即将推出语音引擎,可以让用户从 15 秒的样本中生成语音的合成副本。该模型支持 OpenAI 的人工智能聊天机器人 ChatGPT 中的语音和“朗读”功能,以及 OpenAI 文本转语音 API 中提供的预设语音。这或许就是 Sam Altman 在先前访谈中透露的“今年即将发布的 GPT-5 以外的模型”。

OpenAI 的产品人员杰夫·哈里斯 (Jeff Harris) 表示:“该模型同时分析从中提取的语音数据和要大声朗读的文本数据,生成匹配的语音,而无需为每个说话者构建自定义模型。”

该模型可供包括 HeyGen 在内的约 100 个合作伙伴使用,Spotify 自 2023 年 9 月初以来一直在使用它为 Lex Fridman 等知名主持人用不同的语言配音播客。(TechCrunch

微软推出 Azure AI 安全工具应对提示注入攻击

微软为 Azure AI 推出了一系列安全工具,旨在提高 AI 模型的安全性。这些工具包括 Prompt Shields 以防御提示注入攻击,Groundedness Detection 检测 AI 模型的虚构内容,AI 辅助安全评估以及风险和安全监控功能。专家表示,AI 模型的安全性问题仍未完全解决,需要警惕潜在的漏洞。

消息称微软和 OpenAI 正斥资 1000 亿美元打造 Stargate AI 超级计算机

据知情人士透露,微软和 OpenAI 的高管一直在制定一项数据中心项目计划,该项目将包含一台名为“Stargate”的美国超级计算机,配备数百万个专用服务器芯片,为 OpenAI 的人工智能提供动力。据一位曾与 OpenAI 首席执行官 Sam Altman 交谈过的人士以及一位看过微软部分初始成本估算的人士透露,该项目的成本可能高达 1000 亿美元。(The Information

DeepMind:足够成本下,大语言模型幻觉不再是问题

谷歌 DeepMind 发表《大语言模型的长篇事实性》(Long-form factuality in large language models)论文,得出结论:只要付出足够成本,大语言模型幻觉将不再是问题。

大语言模型在响应开放式主题的 fact-seeking(事实寻求)提示时,通常会生成包含事实错误的内容,DeepMind 针对这一现象进行了一些探索性研究。

实证结果表明,LLM 智能体可以实现超越人类的评级性能。在一组约 16K 个单独的事实上,SAFE 在 72% 的情况下与人类注释者一致,且在 100 个分歧案例的随机子集上,SAFE 的赢率为 76%。同时,SAFE 的成本比人类注释者便宜 20 倍以上。研究者还使用 LongFact,对四个大模型系列(Gemini、GPT、Claude 和 PaLM-2)的 13 种流行的语言模型进行了基准测试,结果发现较大的语言模型通常可以实现更好的长篇事实性。

论文作者之一、谷歌研究科学家 Quoc V. Le 表示,这篇对长篇事实性进行评估和基准测试的新工作提出了一个新数据集、 一种新评估方法以及一种兼顾精度和召回率的聚合指标。同时所有数据和代码将开源以供未来工作使用。

论文:https://arxiv.org/pdf/2403.18802.pdf

GitHub:https://github.com/google-deepmind/long-form-factuality

消息称 Accel 领投的数据标注独角兽 Scale AI 估值接近130亿美元

据直接知情人士透露,风险投资公司 Accel 是数据标签初创公司 Scale AI 的早期投资者,该公司正在就领投新一轮融资进行谈判,这将使该初创公司的估值提高近 80%,达到约 130 亿美元。

这项投资将使 Accel 能够维持这家有价值的初创公司的大部分股份,该初创公司对 OpenAI 和其他对话式 AI 初创公司销售服务的能力得到了提升。其中一位知情人士表示,为人工智能模型示记图像或文本的 Scale 正在洽谈本轮融资数亿美元。(The Information

AI 语音克隆公司 ElevenLabs 与 Rabbit AI 达成合作

AI 语音克隆创企 ElevenLabs 宣布与 AI 硬件创企 Rabbit AI 达成合作。ElevenLabs 首席执行官 Mati Staniszewski 说:“我们的合作是为了让 R1 成为真正充满活力的副驾驶。”当 R1 用户通过语音执行高级命令时,ElevenLab 支持的语音将以真实的声音并保持低延迟进行回复。

开源应用 Podgenai:利用 GPT-4 AI 生成交互式信息播客

HackerNews 目前讨论一款开源软件 Podgenai,其利用先进的 GPT-4 大模型技术,可自动生成一小时长的信息音频播客。用户只需输入主题,程序将选择语音风格、列出相关子话题,并使用 LLM 生成对应文本及语音内容,再通过 ffmpeg 合并成完整的 mp3 文件。生成样例包括多种话题,如 PyTorch 教程、纽约城市介绍、比特币解析等。用户需提供 OpenAI API 密钥并承担生成费用(预计 2024 年每生成一次成本低于 2 美元)。

GitHub:https://github.com/impredicative/podgenai

亚马逊云科技:AI 人才薪资增幅或超 33%

亚马逊云科技发布最新研究表明,预计到 2028 年,AI 技术将在中国企业得到普遍应用。并且中国企业对 AI 人才非常重视,愿意为具备相关技能的人才提供平均高出 33% 的薪资。但目前具备 AI 技能的人才缺口巨大,企业在相关人才的招聘和培训方面都面临挑战。针对此,亚马逊云科技将在中国推出一系列 AI 知识培训课程,帮助企业和员工强化 AI 技术应用并有效提升生产力。

创新奇智发新模型 AInno-75B

创新奇智发布智孔明工业大模型 2.0 版本(AInno-75B)及多款大模型原生应用,奇智孔明工业大模型参数量达到 750 亿以上,增强了海量知识管理、复杂逻辑推理、长流程任务编排、Agent 智能体以及更多工业模态的生成能力。创新奇智在发布会上提到,在中国信通院可信 AI 工业大模型评测中,AInno-75B 于业内首家通过评测,且达到当前最高评级(4+级;在 SuperCLUE 工业大模型基准评测中,奇智孔明工业大模型位列国内第 1 和卓越领导者象限。

百度升级 7 款大模型应用已全面 SaaS 化

百度智能云在“AICloud Day:大模型应用产品发布会”上,面向企业营销、对客服务、知识管理、数据洞察、代码编程等多个企业通用场景,升级数字人平台百度智能云曦灵、智能客服平台百度智能云客悦、内容创作平台“一念”、知识管理平台“甄知”、超级办公入口“超级助理”、生成式 BI 产品“百度 GBI”,以及代码助手“Baidu Comate” 7 大产品。本次百度智能云升级的 7 大产品已实现全面 SaaS 化,企业在网页端即可使用。

Keep 在线 5000 节运动课程 15% 为 AIGC 生产

据 Keep 联合创始人彭唯透露,Keep 在线有 5000 节官方运动课程,其中 15% 为 AIGC 生产。他表示今年 Keep 将会继续投入 AI 资源,提升这一比例,包括在专业课程方向和运动数据方向同时发力,引入算法能力以提升专业度,并上线运动评估体系,基于运动科学、运动数据和算法来帮助用户感知身体状态和运动能力的变化。运动评估体系还可以在无心率设备下,每天为 100 万运动用户预估运动负荷、最大摄氧量、FTP 等数据。目前,该体系已服务 1500 万用户。(第一财经

4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「全球机器学习技术大会」将在上海环球港凯悦酒店举行,特邀近 50 位技术领袖和行业应用专家,与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫码进一步了解详情。

最新文章
2021年12月14日 | 李克强院士再解读,中国智能网联汽车要如何走?
一夜之间,汽车业产业已经从夕阳产业变成了朝阳产业,百年未有之大变革是新一代互联技术赋能传统汽车的结果。变革之中,汽车产业发生了哪些变化?智能网联汽车技术如何创新?中国智能网联汽车路在何方?前不久,2021年院士增选出炉,3位出
AI重塑医患交互:共创未来医疗新格局
引言:医患关系一直以来都备受关注,但在传统医疗模式下,存在着信息不对称、高昂的医疗费用等问题,导致医患关系紧张。随着人工智能(AI)的快速发展,它已经开始重塑医患交互,为医疗行业带来了巨大的变革。本文旨在探讨AI在医患交互中的
google优化 google优化注意事项有哪些
其实目前网络上有关谷歌优化的方法有很多,但是今天小编在这里给大家推荐的这些谷歌优化方式,在很多文章当中都没有提到,算得上是一种新颖的内容,所以今天我们就一起来看一看吧。google优化——google优化排名注意事项1.排名第一未必是最
Linux新建用户设置root权限
一、建立新用户1. 登录root用户2. 创建新用户其中参数的意义如下:-r:建立系统账号-m:自动建立用户的登入目录-s:指定用户登入后所使用的shell3. 手动为用户设置密码二、为新用户增加root权限:1. 切换到root用户后 输入root用户密码2.
2025广东选调生报名推荐表填写流程解读_中共云浮市纪律检查委员会、云浮市监察委员会二级主任科员以下岗位已有0人报名
  广东选调生考试网提供以下选调生选调生信息:2025广东选调生报名推荐表填写流程解读_中共云浮市纪律检查委员会、云浮市监察委员会二级主任科员以下岗位已有0人报名,更多关于2025广东选调生报名推荐表填写流程解读,中共云浮市纪律检查
CentOS服务器最新分区方案
我的服务器是500G。最重要的是/var分区一定要大(不论postfix邮件,还是LAMP的WEB 服务器等)。 最好是400G以上。具体的/boot 只要100M就足够了。 下面是我的分区方案: 硬盘500G服务器分区的方案: 分区类型 分区
2023好玩的多人开黑游戏有哪些 热门的多人联机手游排行榜
大家知道2023好玩的多人开黑游戏有哪些吗?最近许多网游都在调侃,过年期间要如何与小辈之间搞好关系,许多网友作为一家人小辈里最大的,需要承担带领弟弟妹妹们玩的职责,而手游就是大家选出来,拉近关系的工具,特别是一些能够开黑的手游
ChatGPT 网页版国内登录入口
ChatGPT是美国的人工智能研究公司OpenAI开发的智能聊天机器人,这款AI系统秒杀了市面上所有Ai功能,几乎完美突破了以往所有类似软件的瓶颈,能趋于人工智能技术,更自然且精良地做到各种语言的处理。ChatGPT官网:https://chat.openai.com/
2024年新奥精准资料包免费全览|综合解答落实ChatGPT 说:
揭秘2024年新奥精准资料包免费全览:综合解答ChatGPT的独到见解导语:随着科技的飞速发展和大数据时代的来临,获取精准资料已成为各行各业成功的关键,本文将为您揭示关于即将到来的2024年新奥精准资料包的免费全览信息,并结合ChatGPT技术
ai智能回复软件现成案例快速上线
随着人工智能技术的飞速发展,AI绘画小程序和AI智能问答系统已经成为了当今炙手可热的话题。而ChatGPT作为一款强大的自然语言处理模型,更是为我们提供了强大的支持。本文将为你详细介绍如何搭建和部署一个基于ChatGPT的AI绘画小程序,让你
相关文章
推荐文章
发表评论
0评