AIAS1/1_image_sdks
2024-11-13 10:21:20 +08:00
..
classification 更新模型加载说明 2024-11-13 10:21:20 +08:00
crowd_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
face_sdks 更新模型加载说明 2024-11-13 10:21:20 +08:00
feature_extraction_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
fire_smoke_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
image_alignment_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
image_colorization_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
image_text_40_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
image_text_sr_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
ocr_sdks 更新模型加载说明 2024-11-13 10:21:20 +08:00
pedestrian_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
seg_sam2_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
seg_unet_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
smart_construction_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
super_resolution_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
vehicle_sdk 更新模型加载说明 2024-11-13 10:21:20 +08:00
README_CN.md update readme. 2024-10-20 14:01:45 +08:00
README.md update readme 2024-10-20 16:27:54 +08:00

项目清单:

    1. 1_image_sdks - [图像识别 SDK]
  1). 工具箱系列:图像处理工具箱(静态图像)
  2). 目标检测
  3). 图像分割
  4). GAN
  5). 其它类别OCR等
      ...

OCR工具箱 1OCR方向检测与旋转 - ocr_sdks/ocr_direction_det_sdk

OCR图像预处理。

OCR工具箱 2OCR文字识别 - ocr_sdks/ocr_v3_sdk

1. V3 文本检测:
- 中文文本检测
- 英文文本检测
- 多语言文本检测
2. V3 文本识别:
- 中文简体
- 中文繁体
- 英文
- 韩语
- 日语
- 阿拉伯
- 梵文
- 泰米尔语
- 泰卢固语
- 卡纳达文
- 斯拉夫

OCR工具箱 3OCR文字识别 - ocr_sdks/ocr_v4_sdk

原生支持旋转倾斜文本文字识别。

OCR工具箱 4版面分析 - ocr_sdks/ocr_layout_sdk

可以用于配合文字识别,表格识别的流水线处理使用。
1. 中文版面分析
2. 英文版面分析
3. 中英文文档 - 表格区域检测

OCR工具箱 5 表格识别 - ocr_sdks/ocr_table_sdk

中英文表格识别。

OCR工具箱 6 led文字识别 - ocr_sdks/ocr_led_sdk

led表盘文字识别。

人脸工具箱 1人脸检测(含5个人脸关键点) - face_sdks/face_detection_sdk

人脸检测(含5个人脸关键点)提供了两个模型的实现。

人脸工具箱 2人脸对齐- face_sdks/face_alignment_sdk

根据人脸关键点对齐人脸。

人脸工具箱 3人脸特征提取与比对- face_sdks/face_feature_sdk

人脸识别完整的pipeline人脸检测(含人脸关键点) --> 人脸对齐 --> 人脸特征提取 --> 人脸比对

人脸工具箱 4人脸分辨率提升- face_sdks/face_sr_sdk

包含两个功能:
1.单张人脸图片超分辨。
2.自动检测人脸,然后对齐人脸后提升分辨率。

人脸工具箱 5图片人脸修复- face_sdks/face_restoration_sdk

- 自动检测人脸及关键地,然后抠图,然后根据人脸关键点转正对齐。
- 对所有转正对齐的人脸提升分辨率。
- 使用分割模型提取人脸,逆向变换后贴回原图。

人脸工具箱 6口罩检测 - face_sdks/mask_sdk

口罩检测,给出检测框。

动物分类识别 - classification/animal_sdk

动物识别sdk支持7978种动物的分类识别。

菜品分类识别 - classification/dish_sdk

菜品识别sdk支持8416种菜品的分类识别。

烟火检测 - fire_smoke_sdk

烟火检测,给出检测框和置信度。

行人检测 - pedestrian_sdk

行人检测,给出检测框和置信度。

反光衣检测 - reflective_vest_sdk

实现施工区域或者危险区域人员穿戴检测。

智慧工地检测 - smart_construction_sdk

支持检测的类别:人体,安全帽。

车辆检测 - vehicle_sdk

车辆检测,给出检测框和置信度。

图片特征提取(512维)SDK - feature_extraction_sdk

提取图片512维特征值并支持图片1:1特征比对给出置信度。

图像&文本的跨模态相似性比对检索 SDK【支持40种语言】 - image_text_40_sdk

-图像&文本特征向量提取
-相似度计算
-softmax计算置信度

图像矫正 - image_alignment_sdk

-自动检测边缘,透视变换转正

文本图像超分辨 - image_text_sr_sdk

-可以用于提升电影字幕清晰度。

图像超分辨(4倍)- super_resolution_sdk

-提升图片4倍分辨率。

黑白图片上色 - image_colorization_sdk

-应用到黑白图像中,从而实现黑白照片的上色。

一键抠图工具箱 - 1. 通用一键抠图

- seg_unet_sdk
-包括三个模型:满足不同精度,速度的要求。

一键抠图工具箱 - 2. 动漫一键抠图

- seg_unet_sdk
无需手动绘制边界,大大提高了抠图的效率和精准度。应用场景如:
- 广告设计
- 影视后期制作
- 动漫创作等

一键抠图工具箱 - 3. 衣服一键抠图

- seg_unet_sdk
衣服一键抠图应用场景可以在很多方面发挥作用,以下是一些简要介绍:
- 电子商务
- 社交媒体
- 广告设计
- 时尚设计
- 虚拟试衣

一键抠图工具箱 - 4. 人体一键抠图

- seg_unet_sdk
-人体一键抠图可以将人体从背景中抠出,形成一个透明背景的人体图像。