06月

08日

  • Zyphra推出具备1.3T tokens的大模型训练数据集Zyda

    牛透社消息:6 月 7 日,初创公司 Zyphra 推出人工智能训练数据集 Zyda,旨在帮助研究人员构建大型语言模型(LLM)。

    这家由英特尔资本(Intel Capital)提供未公开金额资金支持的初创公司,计划在开源许可下提供 Zyda。Zyphra 表示,该数据库包含价值 1.3 T tokens 的信息。

    Zyda 旨在解决的挑战是,构建大型语言模型所需的大型训练数据集可能非常耗时。原因是开发人员不仅要收集所需的数据,还要过滤掉可能包含的任何不必要和不准确的信息。通过消除从头开始执行此任务的需要,Zyda 有可能减少构建新的大型语言模型所需的时间。

     

意见反馈
返回顶部