首页 > 编程知识 正文

神经网络训练数据集,图神经网络使用的数据集

时间:2023-05-03 17:40:04 阅读:10442 作者:4694

随着人工智能的兴起,机器学习(ML )和深度学习(ML )发展迅速,应用于计算机视觉(CV )、自然语言处理(NLP )、推荐等多个领域。 一些研究已经开发出了将ML/DL应用于社交网络、社区分类、大脑网络分析等网络任务的方法。 在这些任务中,数据用图g(v,e )表示。 其中v表示节点集合,e表示边集合:节点表示数据点,边表示节点之间的连接。 图数据集上的ML/DL是一个新的研究课题,许多方面需要研究。 因此,拥有一组有趣实用的数据集将有助于研究和开发过程。 本文为ML/DL图网络的研究提供一些实用的数据集。

Yelp数据集

ylp是美国版的大众点评,这是一个有趣的链路预测数据集,可以应用于推荐任务。 链路预测任务的目的是学习预测两个节点之间的链路将来是否连接的模型。 数据集包含有关用户、业务和评估信息的json文件。 也包括商家的照片。 此数据集可用于许多任务,是ML/DL任务的理想实用数据集。

在此下载:https://www.yelp.com/dataset。

亚马逊评论数据集

与Yelp数据集一样,亚马逊审阅数据集收集有关产品、用户(元数据、与朋友的连接、名称、位置……)和用户对产品的审阅的信息,包括照片、星级评估、元数据和产品说明此数据集非常适合于链路预测和节点分类任务。 与yelp一样,链路预测在电子商务中具有实用的推荐APP应用。 节点分类任务应用于对销售服务的产品的评估。 从学术角度看,可以用来实现许多实验,包括异构图、关系图、知识图实验等。 评论总数为2.331亿(1996年5月至2018年10月)。

可以从3https://nijia NMO.github.io/Amazon/index.html访问数据集。

Flickr数据集

此数据集是通过在共享Flickr公共映像时形成链接而构建的。 边缘在来自同一位置的图像、提交到同一画廊、组或收藏的图像、共享公共标签的图像、朋友拍摄的图像等之间形成。 数据集是从许多源收集的,图像表示SIFT从它们中提取的特征。 此数据集包含105938张图像和2316948张图像之间的链接。 该数据集非常适合图像分类、对象检测和分割等CV任务。 相信通过图ML/DL的聚合过程,可以提高ML/DL模型的健壮性和可靠性。

可以通过以下连接访问数据集:

3359 snap.Stanford.edu/data/we B- Flickr.html

3359 LMS.com p.NUS.edu.SG/WP-content/uploads/2019/research/NUS wide/NUS-wide.html

假新闻/健康数据集

随着社交媒体的兴起,新闻传播得更快,更有效。 但是,大部分消息质量低,不可靠。 目前,为了解决假新闻检查的问题进行了大量的研究。 大多数工作都用NLP模型解决这个问题。 但是,我们也可以用图ML/DL解决这个问题。 原始新闻和共享新闻有很多共同点,它们的联系可以用来解决问题。 解决问题的拓扑是一种新的观点和方法,可能可以提高性能和鲁棒性。 FakeNewsTracker会搜索数据,并从推特和许多其他社交媒体页面提取新闻。 此数据集非常适合于图ML/DL中的许多任务。 节点分类、链路预测、图分类。

数据集的地址如下:

3359 github.com/kaidmml/fakenewsnet

3359 Zeno do.org/record/3841644 #.ysgprc1h1gm

SNAP数据集

斯坦福网络分析平台(SNAP )是一个常见的网络分析和图形挖掘库。 它是用c写的,可以轻松扩展到具有数亿个节点和数十亿条边的大型网络。 有效处理大图表,计算结构属性,生成规则和随机图表,支持节点和边属性。

这个项目有很多小/中/大的图形数据集。 但是,这些大部分在实际的APP应用中并不实用。 但是这些数据集可以应用于理论研究,提高应用效率。

地址是https://snap.stanford.edu/

本文介绍了一些有趣实用的数据集,用于ML/DL实验。 我希望这篇文章对你的研究有帮助。 谢谢你读这篇文章。

作者: Khang Tran

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。