清智孵化器

多样化AI数据集市场

精选高质量标注数据，覆盖多领域多模态，满足不同场景的模型训练需求

图像数据

多场景人脸图像数据集

包含不同光照、姿态、表情的人脸图像，标注了性别、年龄等属性

10万+样本高精度标注

文本数据

多领域中文对话数据集

包含客服、医疗、教育等多领域对话数据，标注了意图和实体信息

50万+样本多轮对话

语音数据

环境声音识别数据集

包含交通、自然、人为活动等多种城市环境声音，标注了声音类别

20万+样本多采样率

多模态

视听多模态数据集

图像文本描述、视频文本描述、语音文本对齐等多模态数据，涵盖文本、图像、视频、音频等多种不同模态的数据类型

30万+样本多模态关联

开源模型资源库

精选优质开源AI模型，涵盖多种任务类型，支持直接下载与部署应用

BERT-Base

NLP

基于Transformer的预训练语言模型，适用于文本分类、命名实体识别、问答系统等多种自然语言处理任务。

364MB

12层

5.0

ResNet-50

深度残差网络，适用于图像分类、目标检测、图像分割等计算机视觉任务，具有较好的特征提取能力。

97MB

50层

4.8

Whisper Small

语音

自动语音识别模型，支持多语言语音转文字，适用于语音助手、字幕生成等场景，识别准确率高。

1.5GB

99种语言

4.9

CLIP

多模态

对比语言-图像预训练模型，能够连接视觉和语言模态，适用于跨模态检索、零样本分类等任务。

960MB

多模态

4.7

YOLOv8

实时目标检测模型，兼顾检测速度和精度，适用于监控系统、自动驾驶、物体计数等实时检测场景。

63MB

实时检测

4.9

GPT-2

NLP

生成式预训练Transformer模型，适用于文本生成、续写、摘要等自然语言生成任务，中等模型规模。

1.5GB

1.5B参数

4.6