联发科推出全球首个繁体中文 AI 大语言模型 BLOOM-zh,现已开放使用

IT之家 4 月 30 日消息,联发科 4 月 28 日官宣,旗下 AI 研究小组日前发布了全球首个繁体中文 AI 大型语言模型(LLM)。这一多语言模型名为 BLOOM-zh,号称在大多数繁体中文基准测试中优于其前身,同时保持其英语能力。联发科表示,BLOOM-zh 起源于 BigScience 于 2022 年推出的开源 BLOOM 模型,团队对 BLOOM 进行了额外的繁体中文和英文 74 亿个 token 的扩展预训练,涵盖了新闻、书籍、百科全书、教材、口语等多个领域。为了展示 BLOOM-zh 的特性,现有的和新创建的基准场景都用于评估性能。此外,联发科的 AI 研究小组在 ICLR 国际表征学习大会上发表了一篇论文,详细介绍了其使用 Fisher-Legendre(FishLeg)优化的新算法,可以比以前更快、更可靠地训练 AI 模型。该研究是与英国剑桥大学的神经动力学和控制组合作进行的。联发科 AI 研究小组将在 5 月 1 日的 ICLR 会议上展示这项成果。IT之家附相关内容链接:BLOOM-zh 论文:点此查看 BLOOM-zh 大模型:点此使用 FishLeg 算法论文:点此查看 FishLeg 开源页面:点此进入

A person who loves writing, loves novels, and loves life.Seeking objective truth, hoping for world peace, and wishing for a world without wars.
联发科推出全球首个繁体中文 AI 大语言模型 BLOOM-zh,现已开放使用

IT之家 4 月 30 日消息,联发科 4 月 28 日官宣,旗下 AI 研究小组日前发布了全球首个繁体中文 AI 大型语言模型(LLM)

这一多语言模型名为 BLOOM-zh,号称在大多数繁体中文基准测试中优于其前身,同时保持其英语能力。

联发科表示,BLOOM-zh 起源于 BigScience 于 2022 年推出的开源 BLOOM 模型,团队对 BLOOM 进行了额外的繁体中文和英文 74 亿个 token 的扩展预训练,涵盖了新闻、书籍、百科全书、教材、口语等多个领域。为了展示 BLOOM-zh 的特性,现有的和新创建的基准场景都用于评估性能。

此外,联发科的 AI 研究小组在 ICLR 国际表征学习大会上发表了一篇论文,详细介绍了其使用 Fisher-Legendre(FishLeg)优化的新算法,可以比以前更快、更可靠地训练 AI 模型。该研究是与英国剑桥大学的神经动力学和控制组合作进行的。联发科 AI 研究小组将在 5 月 1 日的 ICLR 会议上展示这项成果。

IT之家附相关内容链接:

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow