law难以实现 北大华为证明低精度下scaling 精度与通用性不可兼得 本工作来自北京大学智能学院王立威、贺笛老师课题组与华为诺亚方舟实验室李震国、孙嘉城研究员,作者包括智能学院博士生冯古豪、古云天、罗胜杰;信息科学技术学院本科生杨铠、艾心玥,大模型量化通过将模型参数从较...