RAG要过时了 推理速度4.3倍加速 Qwen2.5更新百万超长上下文 网友 国产大模型,最近有点卷,这不,刚在写代码这事儿上刷新SOTA,Qwen2.5系列又双叒突然更新了——一口气读三本,三体,不费事,并且45秒左右就能完整总结出这69万token的主要内容,还真不是糊弄事...