Gorden Sun

Gorden Sun

0 关注者

7小时前

模型架构的AlphaGo时刻 上海交大发布的论文,这篇论文提出并证明了一个观点:AI能够自主发现新的创新架构,并写出代码实现和验证性能。他们设计的模型ASI-Arch,在超过 2万个 GPU 小时的时间内进行了 1773 次自主实验,发现了 106 个创新的、更好的线性注意力架构。 论文: