浅说数据要素

在人工智能和大数据时代,数据是很重要的资产,是模型赖以产生的源头。在各行各业,都需要开始积累相关的行业数据,为后续的模型不断的更新和快速的迭代做准备。

行业或领域内好的数据可以加快相关技术的迭代发展速度,就拿图像视觉领域来说,由于开源了ImageNet数据集,在上一个十年期间,图像识别竞赛具有显著影响力,催生了深度学习的快速发展,如卷积神经网络,深度网络VGG,深度残差网络ResNet等等关键的深度学习网络backbone,图像视觉成为了发展最快的人工智能应用领域。

其他垂直行业或相关领域的公开数据集也有很多,如目标检测和语义分割的coco,pascal voc,NLP,Speech里边也开源了很多数据集供竞赛打榜和科研论文的算法比较等,为相关行业建立基准的benchmark。

Nature子刊现在也有Scientific Data子刊,可以发布不同行业的标准的数据集,方便相关行业的科研人员能够较快从事相关领域的算法研发和验证。

随着行业发展的需要,数据的体量也在不断的增长,相关行业产业的公司和研究机构也在不断积累数据,将数据保存好不断积累保证安全和便捷检索和访问,可以保证在科技不断发展的同时,“粮草”是足够的,技术更新迭代不会受到数据欠缺导致的生产力滞后的问题。所以相关行业还是要充分重视数据的积累和标记检索。可以将数据作为企事业的“后勤粮草”战略储备。

国家现在也成立了数据局,以后的数据的管理和存储也将会更加的规范科学。云计算技术里边就有大容量存储的技术,随着云计算技术的不断普及和发展,大数据量的存储将不再是什么技术问题,甚至以后也许我们每个人从出生后所有积累的数据都可以访问,如区块链等相关技术的进一步成熟和推广,以后的数据存取访问的模式也会发生变化。随着工程技术的发展,云计算也许能够和区块链技术更好的结合起来,后面我们的云计算专业也可以考虑紧跟时代步伐,将最新的技术进行介绍和引入,期待更加成熟和安全便捷的数据存储和访问技术,为相关产业的数字化的快速发展提供良好的保障。

References

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *