压缩算法为大语言模型“瘦身”
来源:科技日报 发布时间:2024-11-23 10:35:22

据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。

团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。

CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。

虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。

团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。

不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。

标签:

上一篇:世界模型WHALE来了!

下一篇:最后一页

猜你喜欢

压缩算法为大语言模型“瘦身”

据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA...更多

2024-11-23 10:35:22

世界模型WHALE来了!

人类能够在脑海中设想一个想象中的世界,以预测不同的动作可能导致不同的结果。受人类智能这方面的...更多

2024-11-23 10:33:07

从技术研究迈向标准研究 6G渐成全球科技创新焦点

全球6G发展大会现场。 资料照片  随着5G进入规模商用阶段,6G逐渐成为全球科技创新的焦...更多

2024-11-21 10:04:53

软件业用新创造价值

第二十六届中国国际软件博览会上,与会嘉宾在博览会设置的软件成果展上参观。新华社记者 赵子硕摄&...更多

2024-11-21 10:02:36

我国载人登月火箭完成整流罩分离试验

记者20日从中国航天科技集团一院获悉,该院抓总研制的长征十号系列火箭近日成功完成整流罩分离试验...更多

2024-11-21 10:00:55

江门中微子实验探测器主体建成

20日,位于地下700米的江门中微子实验探测器主体建成。中微子,作为构成物质世界的基本粒子之一,不...更多

2024-11-21 09:59:19

商业航天,市场之路该怎么走?

11月11日,力箭一号遥五运载火箭在东风商业航天创新试验区发射升空,将15颗卫星顺利送入预定轨道。&...更多

2024-11-21 09:57:22

我国快递年业务量首次突破1500亿件

11月17日,国家邮政局邮政业安全中心中国快递大数据平台显示,我国快递年业务量首次突破1500亿件大...更多

2024-11-21 09:55:43

科技自立自强之院士说丨欧阳明高:AI加速固态电池

 新华网北京11月21日电(记者 凌纪伟)随着新能源汽车、储能装置的快速发展,产业对新型电池...更多

2024-11-21 09:53:26

中国·极地·老船长

今年,是中国极地考察40周年三位多次远赴冰雪两极的老船长一起追忆往昔,在地球两极写下的传奇故事...更多

2024-11-21 09:51:45