Arm正式IPO，Meta方案对标GPT-4练习下一代大模型，Adobe Firefly 生成式 AI 模型全面敞开商用｜36氪GPT周报

发布时间：2025-05-10　点此：1236次

作者：子渝

独特的Arm正式IPO，Meta计划对标GPT-4训练下一代大模型，Adobe Firefly 生成式 AI 模型全面开放商用｜36氪GPT周报的图片

修改：沈筱

微软发布1.3B参数量小模型，作用优于7B参数Llama2

9月11日，微软发布开源模型phi-1.5，在只支撑代码的1.0版别之上加入了一般场景对话。该模型的参数量只要1.3B，但作用现已超过了具有7B参数的Llama2。phi团队一起以为，数据的质量远比数量更重要。所以与一众卷参数量的模型比较，phi-1.5不只参数量不到Llama2的五分之一，练习时所用的token更是少了一个数量级，只用了3千亿的练习数据。但phi-1.5在AGIEval、 LM-Eval等多个Benchmark上都取得了比Llama2还要优异的成果。

https://www.sohu.com/a/721106310_610300

英伟达 GH200 超级芯片初次露脸 MLPerf v3.1，功用跃升 17%

9月11日，推出不到两个月的英伟达GH200 Grace Hopper超级芯片初次露脸MLPerf职业基准测验。在此次测验中，具有更高的内存带宽和更大的内存容量的GH200与H100 GPU比较，功用高出17%。此次MLPerf Inference v3.1基准测验是继4月发布3.0版别之后的又一次更新，这次更新包含了两个方面：引进依据60亿参数大言语模型GPT-J的推理基准测验（AI模型的巨细一般依据它有多少参数来衡量）和改善的引荐模型。

https://www.thepaper.cn/newsDetail_forward_24580685

Meta方案对标GPT-4练习下一代大模型

9月11日音讯，Meta购入很多英伟达H100芯片，并活跃扩建数据中心，削减对微软Azure云渠道的依靠，以创建一款更为强壮、杂乱的谈天机器人。Meta 将 GPT-4 作为其下一个 AI 模型的规范，并方案在2024年开端练习，旨在仿照人类的表情和爱情，供给愈加传神的交互体会。依据此前走漏的音讯，Instagram正在测验一个具有30种性情的谈天机器人，可能与公司行将推出的未发布的人工智能“人物”相关联。

https://new.qq.com/rain/a/20230911A04IZL00

字节跳动旗下“悟空查找”App更名“小悟空”，供给200+AI东西

9月11日音讯，字节跳动于上一年推出“悟空查找”App，主打“无广告查找”。现在，这款 App 宣告更名为“小悟空”。小悟空 App 内包含依据大言语模型的 AI 东西合集，支撑智能对话和辅佐引荐功用。智能东西分类包含创造生成、学习进步、作业职场、专业咨询、虚拟人物、休闲文娱等，用户能够运用该东西进行翻译、法律咨询、兴趣测验等操作。

https://www.ithome.com/0/718/425.htm

研讨发现ChatGPT可在七分钟内完结软件开发，均匀本钱缺乏1美元

9月12日音讯，来自布朗大学和多所我国大学的研讨团队进行了一个试验，探求是否能够用 ChatGPT 的 3.5 版别的言语模型来驱动的人工智能机器人，在没有事前练习的情况下完结软件开发进程。研讨者创建了一个设想的软件开发公司，名为 ChatDev。研讨标明，这个由人工智能驱动的公司均匀能够在不到七分钟内以不到一美元的本钱完结整个软件开发进程，一起经过其“回忆”和“自我反思”的才能辨认和处理“潜在缝隙”。

https://www.ithome.com/0/718/638.htm

国内外高校联合开源强化学习战略，让机器狗能跑酷

9月12日音讯，来自上海期智研讨院、斯坦福大学、上海科技大学、卡内基梅隆大学和清华大学的研讨者联合打开了一个项目，旨在经过开源强化学习战略让机器狗把握多样化的通用技能，以敏捷应对各种场景和妨碍。该项目依据一种新的开源体系，能够学习依据视觉的端到端跑酷战略，无需依靠任何参阅动作数据。这种强化学习办法能够让机器狗学会攀爬高妨碍、越过大空隙、在低妨碍下匍匐、挤过狭小缝隙和跑步等技能，并将这些技能整组成一个依据视觉的跑酷战略，能够直接布置到四足机器人上。

https://new.qq.com/rain/a/20230912A04MBX00

用户反映llama2.mojo完成比llama2.c快20%的作用

9月12日音讯，一名Mojo社区成员将Python程序llama2.py移植到Mojo上，完成了比原版llama.c快20%的作用，显现了Mojo在硬件级优化方面的巨大潜力。Mojo是一种新的面向AI开发人员的编程言语，其方针是将Python的易用性与体系编程功用结合，完成高功用核算。Mojo能够无缝集成Python代码和库，一起供给与C++和CUDA相匹配的功用。Mojo的发明者Chris Lattner表明，他创建的公司Modular新取得的1亿美元融资将用于推进Mojo的进一步展开和产品扩展。

迷人的Arm正式IPO，Meta计划对标GPT-4训练下一代大模型，Adobe Firefly 生成式 AI 模型全面开放商用｜36氪GPT周报的照片

https://finance.sina.com.cn/tech/roll/2023-09-12/doc-imzmmpkq5281189.shtml

腾讯健康发布医疗大模型，并发布AI医疗产品矩阵

9月12日音讯，据腾讯健康官方大众号报导，腾讯健康在日前发布了旗下医疗大模型，并发布“智能问答、家庭医生帮手、数智医疗印象渠道等多场景 AI 产品矩阵”，以及药物发现渠道“云深”（iDrug）。这一医疗大模型依据腾讯混元大模型，适用于案牍生成、智能问答、病历结构化和检索、印象陈述和辅佐确诊等场景，可嵌入医疗环节全流程；一起，在 AI 驱动药物发现方面，腾讯声称，旗下 “云深”（iDrug）渠道已一起具有了小分子药物与大分子药物的加快发现才能。

https://www.ithome.com/0/718/473.htm

Adobe Firefly 生成式 AI 模型全面敞开商用

9月13日音讯，Adobe宣告，经过几个月的测验，Firefly生成式AI模型已正式上线，可在Adobe Creative Cloud、Adobe Express和Adobe Experience Cloud等多个运用中运用。此外，Adobe还推出了一个独立的Firefly网页运用，让用户在不运用特定的Adobe Creative Suite运用的情况下，也能够体会生成式AI的功用。

https://www.ithome.com/0/718/969.htm

华人团队提出Medusa简略结构，可将LLM推理速度进步2倍

9月13日音讯，来自普林斯顿、UIUC等组织的华人团队提出一个用于加快大型言语模型（LLM）推理速度的简略结构Medusa，并于9月12日开源发布。Medusa经过增加多个解码头来加快模型的推理速度，而无需引进额定的草稿模型，这种办法答应研讨人员在单个GPU上微调大模。测验成果显现，Medusa能够将LLM的生成功率进步约2倍。

https://www.chinaz.com/2023/0913/1558833.shtml

清华联合北邮和微信团队推出多智能体世界，可模仿各类社会试验场景

清华大学联合北邮和微信团队推出了一个名为“AgentVerse”的多智能体世界，专门针对大言语模型开发，已在GitHub取得1.1k星标。该项目简化了运用大言语模型构建自定义多智能体环境的进程，只需几行简略装备即可模仿各种社会试验场景，如“囚犯窘境”和“NLP讲堂”。

https://www.thepaper.cn/newsDetail_forward_24583658

阿里云通义千问 AI 大模型现已过存案，正式向大众敞开

9月13日音讯，阿里云今天宣告通义千问大模型已第一批经过存案，并正式向大众敞开。现在，OPPO、得物、钉钉、淘宝、浙江大学等已与阿里云到达协作，依据通义千问练习自己的专属大模型或开发大模型运用。

https://www.ithome.com/0/718/755.htm

知网推出“AIGC 检测服务体系”，用以辨认学术文本中AI 生成内容

9月13日音讯，同方知网官网今天发布公告，宣告全新推出“AIGC 检测服务体系”，声称历时半年，探究 AIGC 运转规则并霸占内容辨认、算法功率、可信评价等技能难题，经大数据测验、检测作用验证、检测功率调优等服务优化改善。初次提出“常识增强 AIGC 检测技能”和若干检测算法，从言语形式和语义逻辑两条链路，用 AI 对立 AIGC，终究完成辨认学术文本中的 AI 生成内容。

https://www.ithome.com/0/718/925.htm

Stability AI 发布文本生成音频产品Stable Audio

9月14日音讯，Stability AI 公司近来推出 Stable Audio，可依据用户输入的文本内容，主动生成多种类型和风格的音频内容，包含音乐、语音、环境声、特效等。Stability AI 声称，Stable Audio 模型能够在一秒内烘托出 95 秒的立体声音频，而且只需要一个 NVIDIA A100 GPU。

柔和的Arm正式IPO，Meta计划对标GPT-4训练下一代大模型，Adobe Firefly 生成式 AI 模型全面开放商用｜36氪GPT周报的视图

https://new.qq.com/rain/a/20230914A015WO00

谷歌被曝小范围测验Gemini，比练习GPT-4算力大5倍

9月15日音讯，据三位直接知情人士泄漏，谷歌现已答应一小部分公司运用 Gemini 软件的前期版别，意味着谷歌行将将其归入顾客服务，并经过公司的云核算服务出售给企业；一起，Gemini 已开端在新的 TPUv5 Pod上进行练习，算力高达～1e26 FLOPS，比练习 GPT-4的算力还要大5倍；别的，Gemini 的练习数据库为Youtube上 93.6亿分钟的视频字幕，总数据集巨细约为GPT-4的两倍。

https://36kr.com/p/2432997666886022

微软开源EvoDiff，用AI生成蛋白质结构

9月15日音讯，微软开源了一个蛋白质生成结构EvoDiff。该结构运用AI技能，能够在没有方针蛋白质结构信息的情况下，生成生成高保真、多样化的蛋白质序列。EvoDiff的中心是一个具有6.4亿参数的模型，该模型经过运用来自不同物种和功用类别蛋白质的数据进行练习，使模型具有生成高质量蛋白质序列的才能。立异之处在于，它不再依靠蛋白质结构信息，而是依据蛋白质序列来生成蛋白质。

https://www.kejixun.com/article/582034.html

Arm正式IPO，上市首日大涨近25%

9月14日，作为本年现在最大IPO，英国芯片规划公司ARM正式登录纳斯达克，首日涨超25%，市值达650亿美元。当今简直一切的手机芯片，都是依据ARM的架构规划的，除此之外，ARM架构在轿车、智能手表等职业也有较高的市占率。ARM表明，因为数据中心和人工智能芯片需求的推进，估计本财年收入增加11%，2025财年收入增加率能到达20%左右。

https://36kr.com/p/2432884592546432

字节团队发布两个AI视频项目，可完成多模态动画生成和文本视频修改

9月15日音讯，字节团队在Github上发布两个AI视频项目。一个是MagicAvatar，主多模态动画生成，能够将文本、视频和音频等不同输入方法转化为动作信号，然后生成和动画化一个虚拟人物；另一个是MagicEdit，专心文本导向的视频修改，用户进行自然言语提示，就可改动视频风格、场景乃至替换视频里的目标或增加元素。现在在Github上，两个项目加起来现已拿到1000+星。

https://36kr.com/p/2417388284961540

百度希壤与高通到达战略协作，拟打造元世界基础设施渠道

9月15日音讯，近期，北京百度网讯科技有限公司与高通无线通信技能（我国）有限公司在北京签署非束缚性战略协作体谅备忘录，将在XR范畴打开全面战略协作。经过此次战略协作的宣告，两边希望在未来打开深度的技能、商场与生态协作，其间包含两边将在XR技能、生成式AI、数字人、工业上下游协同等方面，环绕元世界+生态+职业运用一起打造新一代元世界基础设施渠道。

https://www.chinaz.com/2023/0915/1559598.shtml

国内多个AI绘画网站疑因违规关停

9月15日音讯，国内多个依据AIGC技能树立的AI绘画网站忽然下线。现在，像广阔网友熟知的四必三、哩布哩布等纷繁在无预警情况下被关停，或转移到境外域名，并在国内无法正常拜访。不少网友置疑合规方面或出现问题。

https://mp.weixin.qq.com/s/HdwLkkhyD6OWlO4gUppVuQ

快手敞开AI 文生图功用内测

9月15日，快手宣告在短视频谈论区开端内测 AI 文生图功用 —— 快手 AI 玩评，用户经过输入各种构思文字，可一键生成海量风格图片，更快捷地在谈论区进行兴趣互动。据悉，这是继快手 AI 对话之后，快手在短视频场景内探究并落地的又一 AIGC 才能，这也是业界初次在大型 App 中心事务场景谈论区下运用的 AIGC 才能。

https://www.ithome.com/0/719/336.htm

告发/反应