多样化AI数据集市场

精选高质量标注数据,覆盖多领域多模态,满足不同场景的模型训练需求

多场景人脸图像数据集
图像数据

多场景人脸图像数据集

包含不同光照、姿态、表情的人脸图像,标注了性别、年龄等属性

10万+样本高精度标注
多领域中文对话数据集
文本数据

多领域中文对话数据集

包含客服、医疗、教育等多领域对话数据,标注了意图和实体信息

50万+样本多轮对话
环境声音识别数据集
语音数据

环境声音识别数据集

包含交通、自然、人为活动等多种城市环境声音,标注了声音类别

20万+样本多采样率
视听多模态数据集
多模态

视听多模态数据集

图像文本描述、视频文本描述、语音文本对齐等多模态数据,涵盖文本、图像、视频、音频等多种不同模态的数据类型

30万+样本多模态关联

开源模型资源库

精选优质开源AI模型,涵盖多种任务类型,支持直接下载与部署应用

BERT-Base

NLP

基于Transformer的预训练语言模型,适用于文本分类、命名实体识别、问答系统等多种自然语言处理任务。

364MB
12层
5.0

ResNet-50

CV

深度残差网络,适用于图像分类、目标检测、图像分割等计算机视觉任务,具有较好的特征提取能力。

97MB
50层
4.8

Whisper Small

语音

自动语音识别模型,支持多语言语音转文字,适用于语音助手、字幕生成等场景,识别准确率高。

1.5GB
99种语言
4.9

CLIP

多模态

对比语言-图像预训练模型,能够连接视觉和语言模态,适用于跨模态检索、零样本分类等任务。

960MB
多模态
4.7

YOLOv8

CV

实时目标检测模型,兼顾检测速度和精度,适用于监控系统、自动驾驶、物体计数等实时检测场景。

63MB
实时检测
4.9

GPT-2

NLP

生成式预训练Transformer模型,适用于文本生成、续写、摘要等自然语言生成任务,中等模型规模。

1.5GB
1.5B参数
4.6