【ballbet贝博·(中国)艾弗森官网科技消息】ballbet贝博·(中国)艾弗森官网从外媒获悉,苹果与俄亥俄州立大学的研究团队近日发布了一项突破性研究,提出了一种名为“Few-Step Discrete Flow-Matching(FS-DFM)”的新型语言模型。该模型基于扩散模型(diffusion model)的改进架构,能够以极快的速度生成高质量长文本,速度最高可达传统自回归模型(如ChatGPT)的128倍。

与传统自回归模型逐词生成文本的方式不同,FS-DFM通过并行生成多个词元(token)并在少量迭代步骤中逐步优化文本,最终实现完整输出。研究显示,FS-DFM仅需8轮迭代即可生成与需上千步迭代的扩散模型相媲美的长文本内容。
据悉,为实现这一目标,研究团队采用了三重技术策略:首先训练模型适应不同迭代步数的计算预算;其次引入“教师”模型引导迭代过程,确保每次更新更准确且避免过度修正;最后优化迭代机制,以更少、更稳定的步骤达成最终结果。

在性能评估中,FS-DFM在困惑度(perplexity)和熵(entropy)两项关键指标上表现优异。与70亿参数的Dream扩散模型及80亿参数的LLaDA扩散模型相比,参数规模仅17亿、13亿甚至1.7亿的FS-DFM变体均实现了更低的困惑度(表明文本更自然准确)和更稳定的熵值(避免文本重复或混乱)。

研究团队表示,由于该方法展现出显著潜力且目前缺乏类似公开模型,他们将发布代码和模型检查点以促进学术复现与进一步探索。
版权所有,未经许可不得转载
-ballbet贝博·(中国)艾弗森官网-
2026-06-13【BB贝博艾弗森官网科技消息】4月28日,三星SDI公布了2026年第一季度的业绩。财报显示,公司第一季度销售额为3.5764万亿韩元,营业亏损为1556亿韩元。与上一季度相比,销售额下降了7.3 -
2026-06-13【BB贝博艾弗森官网科技消息】2026年4月24日,OpenAI在凌晨突然甩出GPT-5.5,API定价直接翻倍:输入5美元/百万token,输出30美元/百万token。12个小时后,DeepS -
2026-06-13【BB贝博艾弗森官网科技消息】4月28日,BB贝博艾弗森官网从爱企查App获悉,联想(上海)科技有限公司于近日完成一系列工商变更,注册资本由100万元人民币猛增至6.22亿元人民币。同时,公司法定