kbase media
product
쉽게 비디오 오디오 이미지를 텍스트로 변환하거나 텍스트를 오디오 (Base64)로 되돌리면 더 많은 기능이 예상 될 수 있습니다. 다음은 Swagger2를 사용하는 API-DOC입니다.
참고 시작 로그 : ocr 엔진이 abbyy 사용하는 경우 시작은 fineReader engine license 만료되면 다시 시작해야한다는 것입니다.
# convert部分配置
convert :
# 是否开启每周日1:00am清空上传文件夹
clean-tmp : true
# 是否开启异步接口
enable-async : false
# 同步接口配置
sync :
# 最大上传文件大小
upload-file-size : 50MB
# 上传文件存储路径
output-folder : ./convert/
# 异步接口设置
async :
# 最大上传文件大小
upload-file-size : 500MB
# 上传文件存储路径
output-folder : ./convert/async/
video :
vca :
# 项目依赖于ffmpeg,必须要安装,默认即可
default : ffmpeg
ffmpeg :
# ffmpeg的安装路径
path : /opt/ffmpeg/ffmpeg-3.0/
toImage :
# ffmpeg视频切割图片默认为1帧/5s
fps : 0.2
audio :
# asr引擎配置
asr :
# 可选值:shhan:声瀚引擎(私有化部署),baidu:百度引擎
default : shhan
# asr接口对音频时间长度有限制,所以此值为切割文件的长度,声瀚为20s/段,百度为60s/段
seg-duration : 20
# baidu asr config
baidu :
appId : 11067243
apiKey : iDEvPvY4zT9CzFgYKMQY6eAi
secretKey : Wkeh8gIbB2LrNBtGwuechG8TUkLlB2TY
xfyun :
apiUrl : http://api.xfyun.cn/v1/service/v1/iat
appId : 5be241a0
apiKey : da08f42480e67f574a61290717e8f945
shhan :
# 声瀚引擎base-url
base-url : http://172.16.8.103:8177/shRecBase/
# tts 引擎配置
tts :
default : m2
# tts引擎所支持的单次请求最大文字长度
max-text-length : 500
# m2 tts config
m2 :
base-url : http://222.73.111.245:9090
image :
# ocr 引擎配置
ocr :
# 可选值 youtu|abbyy|tesseract 私有化部署设置abbyy|tesseract
default : abbyy
# tencent youtu ocr tool config
youtu :
appId : 10125304
secretId : AKIDVs45xejwtvmW5SpdkjYGpDUZTIwOp0Hn
secretKey : a0EHCwgHhgnogMCvUr33uhKl195qSwip
userId : 1071552744
# abbyy fineReader engine config
abbyy :
path : /opt/ABBYY/FREngine11/Bin
license : SWTT-1101-1006-4491-7660-4166
# tesseract config
tesseract :
# language package path 设置tessact语言包路径 未设置读取TESSDATA_PREFIX环境变量
datapath : /opt/tesseract/tessdata
# kbase-monitor 监控配置
spring :
application :
name : kbase-media
boot :
admin :
client :
# kbase-monitor url
url : " http://172.16.8.143:8888 "
username : admin
password : admin
management :
endpoints :
web :
exposure :
include : " * "
endpoint :
health :
show-details : ALWAYS
server :
ssl :
enabled : false http://kbs55.demo.xiaoi.com/kbase-media/swagger-ui.html

Tencent-youtu
바이두-아프
브램/FFMPEG-CLI-WRAPPER
Apache/Rocketmq
Ekoz/OCR-API
vim /usr/lib/systemd/system/kbase-media.service 增加
[Unit]
Description=kbase-media
After=syslog.target
[Service]
Type=forking
ExecStart=/opt/kbase-media/startup.sh
ExecReload=/bin/kill -s HUP $MAINPID
ExecStop=/opt/kbase-media/shutdown.sh
PrivateTmp=true
SuccessExitStatus=143
[Install]
WantedBy=multi-user.target #! /bin/sh
/usr/local/jdk1.8/bin/java -Xms1024M -Xmx1024M -Xmn384M -Xss256k -jar /opt/kbase-media/kbase-media-1.0-SNAPSHOT.jar --spring.config.location=/opt/kbase-media/application.yml > /opt/kbase-media/logs/stdout.log &SpringBoot 구성 파일 위치는 SpringBoot 구성 파일을 직접 지정하는 데 사용됩니다.
#! /bin/sh
kill -9 ` ps -ef | grep java | grep -v grep | grep kbase-media | awk ' {print $2} ' `systemctl daemon-reload
systemctl enable kbase-media.service
journalctl -u kbase-media 내장 ffmpeg , 구성 파일의 ffmpeg 경로를 비어있는 것으로 설정하십시오.
.
├── application.yml
├── convert
│ ├── 066b0d47ba45041bbc287418adace090
│ │ └── 066b0d47ba45041bbc287418adace090.aac
│ ├── 066b0d47ba45041bbc287418adace090.mp4
│ ├── f172d854b2a950f7f12f61ce9cf4aec6
│ │ └── f172d854b2a950f7f12f61ce9cf4aec6.pcm
│ ├── f172d854b2a950f7f12f61ce9cf4aec6.rs
│ └── f172d854b2a950f7f12f61ce9cf4aec6.wav
├── docker-compose.yml
├── Dockerfile
├── log
│ └── spring.log
└── target
└── dependency
├── BOOT-INF
├── META-INF
└── org