
该公司与激光雷达制造商和硕(Hesai)合作,于本周推出了一个名为PandaSet的开源数据集,可用于训练自动驾驶的机器学习模型。该数据集是免费的,可用于学术和商业用途,包括使用Hesai的具有类似图像分辨率的前向PandarGT激光雷达以及其机械旋转激光雷达Pandar64收集的数据。据该公司称,这些数据是在旧金山和硅谷的市区行驶时收集的。
Scale首席执行官兼联合创始人亚历山德王(Alexandr Wang)在最近的一次采访中告诉TechCrunch:“人工智能和机器学习是不可思议的技术,具有难以置信的潜在影响,但也会给人带来巨大的痛苦。”。“机器学习绝对是一种垃圾输入、垃圾输出的框架——你真的需要高质量的数据来支持这些算法。这就是我们建立规模的原因,也是我们今天使用这些数据集从开源角度推动行业发展的原因。”
这个激光雷达数据集的目标是免费访问一个密集和内容丰富的数据集,Alexandr Wang说,这是通过在充满汽车、自行车、交通灯和行人的复杂城市环境中使用两种激光雷达来实现的。

开源AV数据并不完全是新生的。去年,Aptiv和Scale发布了nuScenes,一个来自自主车辆传感器套件的大规模数据集。Argo-AI、Cruise和Waymo等多家AV公司也向研究人员发布了数据。Argo-AI发布了精确的数据和高清地图,而Cruise共享了一个数据可视化工具Webviz,它将从机器人上的所有传感器收集的原始数据转换成视觉效果。