您的当前位置：首页 > 新闻 > 正文

Meta 发布 Megabyte AI 模型抗衡 Transformer：解决后者已知问题、速度提升 4 成

2023-05-30 20:57:29 来源：亚汇网

(资料图片仅供参考)

▲图源Arxiv目前Transformer在自然语言处理等领域非常流行，但由于其序列数据的处理方式是逐步进行的，无法并行化处理，因此训练速度较慢；难以处理长序列，因为其在反向传播过程中，梯度很容易消失或爆炸；此外，由于需要在每一步保留历史信息，内存消耗较大。而Megabyte模型将输入和输出序列划分为patch，而不是单个的token。这种架构使得对大多数任务而言字节级别的预测相对容易，例如根据前几个字符预测完成的单词等。这意味着在大型网络中可以精简字符以提升效率，并且内部预测可以使用更小的模型进行。Megabyte模型的这种方法解决了当今AI模型所面临的训练速度、可靠性及硬件占用比挑战。▲图源Arxiv此外，在计算效率方面，相比于等大的Transformer和LinearTransformer，Megabyte模型在固定模型大小和序列长度范围内使用更少的token。因此相对于Transformer，Megabyte模型可以在相同的计算成本下训练内容更丰富、体积更大、性能更好的模型。目前Meta团队放出了Megabyte模型的论文，

标签：

推荐阅读

Meta 发布 Megabyte AI 模型抗衡 Transformer：解决后者已知问题、速度提升 4 成

▲图源Arxiv目前Traforr在自然语言处理等领域非常流行，但由于其序列数据的处理方式是逐步进行的，无法并行

千亿镇何以成“巨无霸”新亮点|新京智库环球热讯

万亿区、千亿县……中国区域经济高歌猛进的同时，无论是城市还是乡村都不断催生出新的“巨无霸”亮点。...

热点聚焦：崔东树：汽车行业利润下滑幅度改善，但利润率仍偏低

作者崔东树全国乘用车市场信息联席会秘书长国家统计局数据显示，2023年1-4月份，随着经济社会全面恢复常态

口腔医学技术就业前景分析（口腔医学技术就业前景）全球观速讯

今天小编宋丹来为大家解答以上的问题。口腔医学技术就业前景分析，口腔医学技术就业前景相信很多小伙伴还不

神十六成功对接空间站组合体_天天时讯

据中国载人航天工程办公室消息，神舟十六号载人飞船入轨后，于北京时间2023年5月30日16时29分，成功对接于

今年清明假期期间，全民航预计运输旅客432.8万人次

奥飞娱乐发布2021年第一季度业绩预告

清明假期北京市共举办90台233场营业性演出，吸引观众7.43万人次

杉杉股份2020年实现的营业收入约82.16亿元

今年一季度长江三峡游船共计接待国内游客3.59万人

国信证券2020年净利润66.16亿元

今年3月重庆两江游共计接待游客14.7万人次

转转集团宣布融资3.9亿美元

我国的粮食安全形势是好的，粮食安全是有保障的

酒鬼酒2020年营收净利实现双增长

重庆百货2020年实现营业收入210.77亿元

马上消费2020年营业收入为76.04亿元，营业利润8.14亿元

共享充电宝品牌街电和搜电正式合并

兔宝宝2021年第一季度营业收入较去年同期增长约为190个百分点

七匹狼2020年净利润约为2.09亿元

东方时尚通过集中竞价交易方式回购股份数量1706.10万股

恒天然已经完成以5.52亿新西兰元出售两个全资中国牧场

搜电充电连续完成两轮融资

周黑鸭2020年收入21.82亿元

映客2020年实现营业收入58.81亿港元，净利润2.3亿港元

福田汽车今年一季度累计销量为20.23万辆

蔚来汽车今年一季度共交付新车20060辆

小鹏汽车今年3月交付新车5102辆

2020年国美零售销售收入约441.19亿元

苏泊尔2020年净利润约为18.46亿元

九阳股份2020年实现营业收入为112.24亿元

2020年国内共有超4000家实体书店开业

秦岭旅游2020年全年营业收入为5386.52万元

2020年思考乐教育实现收入7.49亿元

呷哺呷哺集团2020年营收为54.55亿元

江淮汽车收到政府补贴约5851万元

乐视将推出厨卫产品和智能门锁新品，正式进军厨卫市场

恒大汽车计划今年四季度试生产，明年实现大量交付

华为2020年销售收入为8914亿元

2020年周黑鸭总收益约为21.82亿元

中银消金2020年营收43.10亿元

宝宝树2020年营收为2.12亿元

王朝酒业2020年业绩依然为亏损

2020年51信用卡营收为2.74亿元

2020年度申万宏源证券实现合并营业收入294.09亿元

坑老事件屡有发生保健品坑老为何屡禁不止?

“随心飞”机票套餐服务变成“闹心飞” 兑换难、套路深等问题饱受诟病

家务劳动的价值应该被“看重” 山东芝罘一全职太太离婚获93万家务补偿

“酒店价高，游客挤厕所过夜”由来已久不等于本该如此

限量版球鞋标价为49999元！买到转手就赚了600% “炒物经济”到底在炒什么？

新加坡南洋理工大学研发出植物“沟通”装置未来可成为环境探测器

含硫量超标最高达1700倍治理轻质循环油乱象仍面临“无法可依”困境

主业演员副业医生？高度警惕“网络名医”成为电信诈骗新马甲

今明天北京城区杨柳絮进入高发期且花粉浓度较高易敏人群需注意防护

福布斯富豪榜：贝索斯连续4年全球首富特朗普在富豪榜上的位置下滑300名

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品，均转载自其它媒体，转载目的在于传递更多的信息，并不代表本网赞同其观点和对其真实性负责。亚洲商务网倡导尊重与保护知识产权，如发现本站文章存在内容、版权或其它问题，烦请联系。联系方式：8 86 239 5@qq.com，我们将及时沟通与处理。

新闻更多>

1Meta 发布 Megabyte AI 模型抗衡 Transformer：解决后者已知问题、速度提升 4 成

2千亿镇何以成“巨无霸”新亮点|新京智库环球热讯

3热点聚焦：崔东树：汽车行业利润下滑幅度改善，但利润率仍偏低

4口腔医学技术就业前景分析（口腔医学技术就业前景）全球观速讯

5神十六成功对接空间站组合体_天天时讯

资讯

【数博短评】打造超算坚实底座，加快建设数字中国“高速路”

1【数博短评】打造超算坚实底座，加快建设数字中国“高速路”

2贵州2023年3月份居民消费价格同比上涨0.1% 环比下降0.4%

3今日热讯：贵州新时代闯新路人才高端论坛在筑举行

4每日快播：看，舰舰舰舰舰！遵义舰近距离画面来了

5“五一”将至，贵州将加开多趟列车

快讯

为一百岁的厦门大学“比心”！

魏地春：海员百年工运史是实现好、维护好、发展好广大海员合法权益的历史

产品