.. | ||
classification | ||
crowd_sdk | ||
face_sdks | ||
feature_extraction_sdk | ||
fire_smoke_sdk | ||
image_alignment_sdk | ||
image_colorization_sdk | ||
image_text_40_sdk | ||
image_text_sr_sdk | ||
ocr_sdks | ||
pedestrian_sdk | ||
seg_sam2_sdk | ||
seg_unet_sdk | ||
smart_construction_sdk | ||
super_resolution_sdk | ||
vehicle_sdk | ||
README_CN.md | ||
README.md |
项目清单:
-
- 1_image_sdks - [图像识别 SDK]
1). 工具箱系列:图像处理工具箱(静态图像)
2). 目标检测
3). 图像分割
4). GAN
5). 其它类别:OCR等
...
OCR工具箱 1:OCR方向检测与旋转 - ocr_sdks/ocr_direction_det_sdk OCR图像预处理。 |
|
OCR工具箱 2:OCR文字识别 - ocr_sdks/ocr_v3_sdk 1. V3 文本检测:- 中文文本检测 - 英文文本检测 - 多语言文本检测 2. V3 文本识别: - 中文简体 - 中文繁体 - 英文 - 韩语 - 日语 - 阿拉伯 - 梵文 - 泰米尔语 - 泰卢固语 - 卡纳达文 - 斯拉夫 |
|
OCR工具箱 3:OCR文字识别 - ocr_sdks/ocr_v4_sdk 原生支持旋转倾斜文本文字识别。 |
|
OCR工具箱 4:版面分析 - ocr_sdks/ocr_layout_sdk 可以用于配合文字识别,表格识别的流水线处理使用。1. 中文版面分析 2. 英文版面分析 3. 中英文文档 - 表格区域检测 |
|
OCR工具箱 5: 表格识别 - ocr_sdks/ocr_table_sdk 中英文表格识别。 |
|
OCR工具箱 6: led文字识别 - ocr_sdks/ocr_led_sdk led表盘文字识别。 |
|
人脸工具箱 1:人脸检测(含5个人脸关键点) - face_sdks/face_detection_sdk 人脸检测(含5个人脸关键点)提供了两个模型的实现。 |
|
人脸工具箱 2:人脸对齐- face_sdks/face_alignment_sdk 根据人脸关键点对齐人脸。 |
|
人脸工具箱 3:人脸特征提取与比对- face_sdks/face_feature_sdk 人脸识别完整的pipeline:人脸检测(含人脸关键点) --> 人脸对齐 --> 人脸特征提取 --> 人脸比对 |
|
人脸工具箱 4:人脸分辨率提升- face_sdks/face_sr_sdk 包含两个功能:1.单张人脸图片超分辨。 2.自动检测人脸,然后对齐人脸后提升分辨率。 |
|
人脸工具箱 5:图片人脸修复- face_sdks/face_restoration_sdk - 自动检测人脸及关键地,然后抠图,然后根据人脸关键点转正对齐。- 对所有转正对齐的人脸提升分辨率。 - 使用分割模型提取人脸,逆向变换后贴回原图。 |
|
人脸工具箱 6:口罩检测 - face_sdks/mask_sdk 口罩检测,给出检测框。 |
|
动物分类识别 - classification/animal_sdk 动物识别sdk,支持7978种动物的分类识别。 |
|
菜品分类识别 - classification/dish_sdk 菜品识别sdk,支持8416种菜品的分类识别。 |
|
烟火检测 - fire_smoke_sdk 烟火检测,给出检测框和置信度。 |
|
行人检测 - pedestrian_sdk 行人检测,给出检测框和置信度。 |
|
反光衣检测 - reflective_vest_sdk 实现施工区域或者危险区域人员穿戴检测。 |
|
智慧工地检测 - smart_construction_sdk 支持检测的类别:人体,安全帽。 |
|
车辆检测 - vehicle_sdk 车辆检测,给出检测框和置信度。 |
|
图片特征提取(512维)SDK - feature_extraction_sdk 提取图片512维特征值,并支持图片1:1特征比对,给出置信度。 |
|
图像&文本的跨模态相似性比对检索 SDK【支持40种语言】 - image_text_40_sdk -图像&文本特征向量提取-相似度计算 -softmax计算置信度 |
|
图像矫正 - image_alignment_sdk -自动检测边缘,透视变换转正 |
|
文本图像超分辨 - image_text_sr_sdk -可以用于提升电影字幕清晰度。 |
|
图像超分辨(4倍)- super_resolution_sdk -提升图片4倍分辨率。 |
|
黑白图片上色 - image_colorization_sdk -应用到黑白图像中,从而实现黑白照片的上色。 |
|
一键抠图工具箱 - 1. 通用一键抠图 - seg_unet_sdk-包括三个模型:满足不同精度,速度的要求。 |
|
一键抠图工具箱 - 2. 动漫一键抠图 - seg_unet_sdk无需手动绘制边界,大大提高了抠图的效率和精准度。应用场景如: - 广告设计 - 影视后期制作 - 动漫创作等 |
|
一键抠图工具箱 - 3. 衣服一键抠图 - seg_unet_sdk衣服一键抠图应用场景可以在很多方面发挥作用,以下是一些简要介绍: - 电子商务 - 社交媒体 - 广告设计 - 时尚设计 - 虚拟试衣 |
|
一键抠图工具箱 - 4. 人体一键抠图 - seg_unet_sdk-人体一键抠图可以将人体从背景中抠出,形成一个透明背景的人体图像。 |
|