AppleNeuralHash2ONNX 다운로드 AppleNeuralHash2ONNX 소스 코드 다운로드

AppleNeuralHash2ONNX

기타 카테고리

1.0.0

다운로드

ApplyBelyHash2onnx

CSAM 탐지를위한 Apple Neuralhash 모델을 ONNX로 변환하십시오.

소개

Apple Neuralhash는 신경망을 기반으로 한 이미지에 대한 지각 해싱 방법입니다. 이미지 크기 조정 및 압축을 견딜 수 있습니다. 해싱 단계는 다음과 같습니다.

이미지를 RGB로 변환합니다.
이미지를 360x360 으로 조정하십시오.
RGB 값을 [-1, 1] 범위로 정규화합니다.
Neuralhash 모델에서 추론을 수행하십시오.
생성 된 벡터 128 플로트와 함께 96x128 행렬의 도트 생성물을 계산하십시오.
결과 96 플로트 벡터에 이진 단계를 적용하십시오.
1.0 및 0.0의 벡터를 비트로 변환하여 96 비트 이진 데이터를 만듭니다.

이 프로젝트에서는 Apple의 Neuralhash 모델을 ONNX 형식으로 변환합니다. 모델 테스트를위한 데모 스크립트도 포함되어 있습니다.

전제 조건

OS

MacOS와 Linux가 모두 작동합니다. 다음 섹션에서 Debian은 Linux 예제에 사용됩니다.

LZFSE 디코더

MACOS : brew install lzfse 하여 설치하십시오.
Linux : LZFSE 소스에서 빌드 및 설치.

파이썬

파이썬 3.6 이상이 작동해야합니다. 다음 종속성을 설치하십시오.

pip install onnx coremltools

변환 안내서

1 단계 : Neuralhash 모델을 가져옵니다

최근 MACOS 또는 iOS 빌드에서 4 개의 파일이 필요합니다.

Neuralhash_128x96_seed1.dat
Neuralhashv3b-current.espresso.net
Neuralhashv3b-current.espresso.shape
Neuralhashv3b-current.espresso.weights

옵션 1 : MacOS 또는 JailBroken iOS 장치 (권장)

최근 버전의 MACOS (11.4+) 또는 JailBroken iOS (14.7+)가 설치된 경우, /System/Library/Frameworks/Vision.framework/Resources/ (MacOS) 또는 /System/Library/Frameworks/Vision.framework/ (iOS)에서 이러한 파일을 가져옵니다.

옵션 2 : iOS IPSW에서 (클릭하여 공개)

IPSW.ME에서 최근 iOS 빌드 (14.7+)의 .ipsw 다운로드하십시오.
파일 풀기 :

 cd /path/to/ipsw/file
mkdir unpacked_ipsw
cd unpacked_ipsw
unzip ../ * .ipsw

시스템 이미지 찾기 :

ls -lh

필요한 것은 가장 큰 .dmg 파일 (예 : 018-63036-003.dmg 입니다.

마운트 시스템 이미지. MACOS에서 파일을 Finder에서 열면됩니다. Linux에서 다음 명령을 실행합니다.

 # Build and install apfs-fuse
sudo apt install fuse libfuse3-dev bzip2 libbz2-dev cmake g++ git libattr1-dev zlib1g-dev
git clone https://github.com/sgan81/apfs-fuse.git
cd apfs-fuse
git submodule init
git submodule update
mkdir build
cd build
cmake ..
make
sudo make install
sudo ln -s /bin/fusermount /bin/fusermount3
# Mount image
mkdir rootfs
apfs-fuse 018-63036-003.dmg rootfs

필수 파일은 마운트 경로에서 /System/Library/Frameworks/Vision.framework/ 아래에 있습니다.

동일한 디렉토리 아래에 넣으십시오.

mkdir NeuralHash
cd NeuralHash
cp /System/Library/Frameworks/Vision.framework/Resources/NeuralHashv3b-current.espresso. * .
cp /System/Library/Frameworks/Vision.framework/Resources/neuralhash_128x96_seed1.dat .

2 단계 : 모델 구조 및 모양을 디코딩합니다

일반적으로 Core ML 모델은 model.espresso.net 의 구조를 저장하고 model.espresso.shape 의 형상으로 JSON입니다. Neuralhash 모델에서는 동일하지만 LZFSE로 압축됩니다.

dd if=NeuralHashv3b-current.espresso.net bs=4 skip=7 | lzfse -decode -o model.espresso.net
dd if=NeuralHashv3b-current.espresso.shape bs=4 skip=7 | lzfse -decode -o model.espresso.shape
cp NeuralHashv3b-current.espresso.weights model.espresso.weights

3 단계 : 모델을 Onx로 변환합니다

 cd ..
git clone https://github.com/AsuharietYgvar/TNN.git
cd TNN
python3 tools/onnx2tnn/onnx-coreml/coreml2onnx.py ../NeuralHash

결과 모델은 NeuralHash/model.onnx 입니다.

용법

모델 검사

Netron 은이 목적을위한 완벽한 도구입니다.

OnnxRuntime으로 신경 해시를 계산하십시오

필요한 라이브러리 설치 :

pip install onnxruntime pillow

이미지에서 nnhash.py 실행하십시오.

python3 nnhash.py /path/to/model.onnx /path/to/neuralhash_128x96_seed1.dat image.jpg

예제 출력 :

 ab14febaa837b6c1484c35e6

참고 : 여기서 생성 된 신경 해시는 iOS 장치에서 생성 된 것보다 몇 비트가 발생할 수 있습니다. 다른 iOS 장치가 어쨌든 약간 다른 해시를 생성하기 때문에 예상됩니다. 그 이유는 신경망이 부동 소수점 계산을 기반으로하기 때문입니다. 정확도는 하드웨어에 크게 의존합니다. 더 작은 네트워크의 경우 아무런 차이가 없습니다. 그러나 Neuralhash에는 200 개 이상의 층이있어 크게 누적 오류가 발생합니다.

장치	해시시
iPad Pro 10.5 인치	`2b186faa6b36ffcc4c4635e1`
M1 Mac	`2b5c6faa6bb7bdcc4c4731a1`
iOS 시뮬레이터	`2b5c6faa6bb6bdcc4c4731a1`
ONNX 런타임	`2b5c6faa6bb6bdcc4c4735a1`