维多利亚老品牌vic

新闻中心
新闻中心
您现在的位置:
首页
-
-
英伟达发布大模型,加速AI设计芯片

英伟达发布大模型,加速AI设计芯片

  • 分类:新闻动态
  • 作者:
  • 来源:半导体行业观察
  • 发布时间:2023-10-31
  • 访问量:915

【概要描述】很少有像半导体设计这样具有挑战性的追求。在显微镜下,像NVIDIA H100 Tensor Core GPU(上图)这样最先进的芯片看起来就像一座精心规划的大都市,由数百亿个晶体管构建而成,连接在比人类头发细 10,000 倍的街道上。

英伟达发布大模型,加速AI设计芯片

【概要描述】很少有像半导体设计这样具有挑战性的追求。在显微镜下,像NVIDIA H100 Tensor Core GPU(上图)这样最先进的芯片看起来就像一座精心规划的大都市,由数百亿个晶体管构建而成,连接在比人类头发细 10,000 倍的街道上。

  • 分类:新闻动态
  • 作者:
  • 来源:半导体行业观察
  • 发布时间:2023-10-31
  • 访问量:915
详情

英伟达今天发布的一篇研究论文描述了生成式人工智能如何帮助最复杂的工程工作之一:设计半导体。

 

这项工作展示了高度专业化领域的公司如何利用其内部数据训练大型语言模型 ( LLM ),以构建可提高生产力的助手。

 

很少有像半导体设计这样具有挑战性的追求。在显微镜下,像NVIDIA H100 Tensor Core GPU(上图)这样最先进的芯片看起来就像一座精心规划的大都市,由数百亿个晶体管构建而成,连接在比人类头发细 10,000 倍的街道上。

 

多个工程团队协调长达两年的时间来建造这些数字大城市之一。

 

一些小组定义芯片的整体架构,一些小组制作并放置各种超小型电路,还有一些小组测试他们的工作。每项工作都需要专门的方法、软件程序和计算机语言。

 

 

 

LLM的广阔愿景

 

 

NVIDIA 研究总监兼该论文的主要作者 Mark Ren 表示:“我相信,随着时间的推移,大型语言模型将全面帮助所有流程。”

 

NVIDIA 首席科学家 Bill Dally 今天在国际计算机辅助设计会议上的主题演讲中宣布了这篇论文,该会议是数百名从事电子设计自动化 (EDA) 领域工作的工程师的年度聚会。

 

“这项工作标志着将LLM应用于复杂的半导体设计工作中迈出了重要的第一步,”Dally在旧金山举行的活动中说道。“它展示了即使是高度专业化的领域也可以利用其内部数据来训练有用的生成人工智能模型。”

 

 

ChipNeMo 表面

 

 

该论文详细介绍了 NVIDIA 工程师如何为内部使用创建一个名为 ChipNeMo 的定制LLM,利用公司的内部数据进行培训,以生成和优化软件并协助人类设计师。

 

图片

 

在 EDA 领域拥有 20 多年职业生涯的Ren表示,从长远来看,工程师希望将生成式人工智能应用到芯片设计的每个阶段,从而可能在整体生产力方面获得显着提升。

 

在对 NVIDIA 工程师进行可能的用例调查后,研究团队选择了三个开始:聊天机器人、代码生成器和分析工具。

 

 

初始用例

 

 

后者——一种自动执行维护已知错误更新描述的耗时任务的工具——迄今为止最受欢迎。

 

一个回答有关 GPU 架构和设计问题的原型聊天机器人帮助许多工程师在早期测试中快速找到技术文档。

 

 

图片

 

 

正在开发的代码生成器(如上所示)已经使用芯片设计人员使用的两种专用语言创建了大约 10-20 行软件的片段。它将与现有工具集成,让工程师在进行中的设计中拥有得心应手的助手。

 

 

使用 NVIDIA NeMo 自定义 AI 模型

 

 

该论文主要关注团队收集设计数据并使用其创建专门的生成人工智能模型的工作,这是一个可移植到任何行业的过程。

 

作为起点,该团队选择了一个基础模型,并使用NVIDIA NeMo对其进行了定制,这是一个用于构建、定制和部署生成式 AI 模型的框架,包含在NVIDIA AI Enterprise软件平台中。所选的 NeMo 模型拥有 430 亿个参数,这是对其理解模式能力的衡量标准。它使用超过一万亿个令牌、文本和软件中的单词和符号进行训练。

 

然后,该团队在两轮训练中完善了该模型,第一轮使用了价值约 240 亿代币的内部设计数据,第二轮则混合了约 130,000 个对话和设计示例。

 

这项工作是半导体行业中生成式人工智能的研究和概念证明的几个例子之一,刚刚开始从实验室出现。

 

 

分享经验教训

 

 

Ren团队学到的最重要的教训之一是定制LLM的价值。

 

在芯片设计任务中,具有少至 130 亿个参数的定制 ChipNeMo 模型的性能可与甚至超过具有 700 亿个参数的 LLaMA2 等更大的通用 LLM 的性能相媲美或超过。在某些用例中,ChipNeMo 模型要好得多。

 

他补充说,在此过程中,用户需要注意收集哪些数据以及如何清理数据以供培训使用。

 

最后,Ren建议用户及时了解可以加速和简化工作的最新工具。

 

NVIDIA 研究中心在全球拥有数百名科学家和工程师,专注于人工智能、计算机图形学、计算机视觉、自动驾驶汽车和机器人等主题。最近的其他半导体项目包括使用人工智能设计更小、更快的电路以及优化大块的布局。

 

希望构建自己的定制 LLM 的企业现在就可以开始使用GitHub 和 NVIDIA NGC 目录中提供的NeMo 框架。

 

关键词:

扫二维码用手机看

上海维多利亚老品牌vic电子科技有限公司

联系维多利亚老品牌vic

电话:15021595573
邮箱:sales@zjhuidi.com
地址:
上海市闵行区新龙路360弄万金中心T2-508

版权所有:上海维多利亚老品牌vic电子科技有限公司