09月
05日
Uber 在印度推出驾驶员数字任务计划并升级 350PB 数据湖架构,HiveSync 工具将开源
牛透社 9 月 5 日消息,Uber 在印度推出驾驶员数字任务计划,允许网约车司机和外卖骑手通过应用程序承揽数据标注与信息采集任务,包含图像审核标注、文本语义分类、语音素材采集及票据数字化处理。目前该服务已在 12 个主要城市实施,数万名从业者参与试点,驾驶员碎片时间利用率提升至 37%,额外收入达基础收入的 18%-25%。
同步公布其数据架构升级,建成 350PB 企业级数据湖,自主研发分布式数据同步工具 HiveSync(日处理量 8PB,存储管理 300PB)。Uber 宣布计划将 HiveSync 开源,并与 Google Cloud 推进技术整合,预计 2026 年完成核心 AI 训练系统云迁移。行业分析指出,此举通过激活闲置人力资源,降低了 AI 训练数据成本并构建多元收入生态。