encoding_rsダウンロードencoding_rsソースコードのダウンロード

encoding_rs

ウェブサイトデータ

1.0.0

ダウンロード

encoding_rs

encoding_rsさびに記載されているエンコーディング標準の（javascript以外の部分）の実装。

エンコーディング標準は、Web互換の文字エンコーディングのセットを定義します。つまり、このクレートを使用してWebコンテンツをデコードできます。 Encoding_RSは、Firefox 56から始まるGeckoで使用されます。Web上のレガシーエンコーディングとWindowsで使用されるレガシーエンコーディングとの間に顕著なオーバーラップがあるため、このクレートは非Web関連の状況にも使用できます。隣接する木枠へのリンクについては、以下を参照してください。

さらに、 memモジュールは、IO境界からのデータとは対照的に、RAMインチテキストを扱うためのさまざまな操作を提供します。 memモジュールは、内部実装の詳細効率のため、個別のクレートの代わりにモジュールです。

機能

Geckoユースケースのため、Encoding_RSは、UTF-8へのデコードとエンコードの通常の錆ユースケースをサポートすることに加えて、UTF-16へのデコードとエンコードをサポートします。さらに、APIは、GeckoのC ++側面に対応するためにFFIに優しいように設計されています。

具体的には、encoding_rsは次のことを行います。

有効な整列したネイティブエンディアンインRAM UTF-16（ u16 / char16_tの単位）にエンコードするエンコード標準定義の文字でバイトのストリームを解読します。
エンコードを実行する前に、唯一のサロゲートが置換文字に置き換えられたかのように、エンコード標準定義の文字エンコードで、潜在的に無偏光アライメントされたネイティブエンディアン内のUTF-16（ u16 / char16_t単位）のバイトシーケンスのシーケンスにエンコードします。（GeckoのUTF-16は潜在的に無効です。）
有効なUTF-8にエンコードするエンコード標準定義の文字でバイトのストリームをデコードします。
有効なUTF-8のストリームを、エンコーディング標準定義の文字エンコーディングでバイトのシーケンスにエンコードします。（RustのUTF-8はValidを保証しています。）
上記のストリーミング（入力と出力が複数のバッファーに分割されます）と非ストリーミング（単一のバッファーでの全体の入力と単一のバッファーの全体の出力）バリアントを使用します。
UTF-8にデコードまたはエンコードするときに、非ストリーミングケースで可能な場合は、可能な場合はコピー（借入）を回避します。
プロトコルテキストの文字エンコーディングを識別するテキストラベルを概念的に表すタイプセーフオブジェクトに解決します。
document.characterSetから戻るのに適した文字列にオブジェクトを型にエンコードする型エンコードをマップします。
UTF-8を検証します（一般的な命令セットシナリオでは、標準ライブラリよりもWebワークロードの方が少し速くなります。いつか上流になることを願っています）とASCII。

さらに、 encoding_rs::mem次のことを行います。

バイトバッファにASCIIのみが含まれているかどうかを確認します。
潜在的に不可能なUTF-16バッファに基本的なラテン語のみが含まれているかどうかを確認します（ASCII）。
有効なUTF-8、潜在的に無バリスUTF-8、または潜在的に無値点UTF-16バッファーにLATIN1コードポイントのみが含まれているかどうかを確認します（U+0100未満）。
有効なUTF-8、潜在的に不可解なUTF-8、または潜在的に不可欠なUTF-16バッファー、またはコードポイントまたはUTF-16コードユニットが左から左への動作をトリガーできるかどうかを確認します（単コード双方向アルゴリズムを最適化できるかどうかを確認するのに適しています）。
上記の2つのチェックの組み合わせバージョン。
有効なUTF-8、潜在的に無値点UTF-8およびLATIN1をUTF-16に変換します。
潜在的に無バリスのUTF-16およびLATIN1をUTF-8に変換します。
UTF-8とUTF-16をLATIN1に変換します（範囲の場合）。
潜在的に無効なUTF-16のバッファーで最初の無効なコードユニットを見つけます。
ポテンシャルインバリスUTF-16の可変バッファーを含む有効なUTF-16が含まれています。
ASCIIを1つのバッファーから別のバッファーにコピーして、最初の非ASCIIバイトまでコピーします。
ASCIIをUTF-16に最初の非ASCIIバイトに変換します。
UTF-16をASCIIに最初の非基本ラテンコードユニットに変換します。

`std::io`との統合

特に、上記の機能リストにstd::io::Readをラップする機能は含まれていません。これをUTF-8にデコードし、 std::io::Readを介して結果を表示します。 encoding_rs_ioクレートは、その機能を提供します。

`no_std`環境

クレートはno_std環境で動作します。デフォルトでは、アロックが存在することを想定しているalloc機能が有効になっています。アロッカーターなし環境の場合、デフォルトの機能（つまりalloc ）をオフにすることができます。これにより、 Vec / String / Cowを返すAPIの一部が利用できなくなります。

電子メールの解読

電子メールで発生する文字エンコーディングをデコードするには、これを直接使用する代わりにcharset Crateを使用してください。（このクレートをラップし、UTF-7デコードを追加します。）

Windowsコードページ識別子マッピング

Windowsコードページの識別子とのマッピングの場合は、 codepage Crateを使用します。

DOSエンコーディング

このクレートは、Webプラットフォームでは必要ない単一バイトのDOSエンコーディングをサポートしていませんが、 oem_cpクレートはそうです。

エンコーダーのテキストの準備

テキストをユニコード正規化フォームCに正規化する前に、テキストをエンコードする前にエンコードする前に、マップできない文字を最小限に抑えます。テキストは、 icu_normalizer Crateを使用して、CODEの正規化フォームCに正規化できます。

例外はWindows-1258です。これは、Unicode正規化フォームCに正規化した後、マップできない文字を最小限に抑えるためにトーンマークを分解する必要があります。ベトナムのトーンマークは、 detoneを使用して分解できます。

ライセンス

TL; DR ：（ (Apache-2.0 OR MIT) AND BSD-3-Clause 。

著作権という名前のファイルをご覧ください。

このクレートのWhatWGデータから生成されない非テストコードは、Apache-2.0またはMITの下にあります。テストコードはCC0の下にあります。

このクレートには、WhatWG-Suppliedデータから生成されたコード/データが含まれています。 WhatWG Upstreamは、このクレートの最初のリリースとこのクレートの現在のバージョンの間に、CC0からBSD-3節にソースコードに組み込まれた仕様の一部のライセンスを変更しました。ソース内のライセンスの凡例は、上流のライセンス変更以来変更された生成されたコードの一部に対して更新されています。

ドキュメント

生成されたAPIドキュメントはオンラインで入手できます。

木枠のデザインと内部についての長期の記事があります。

CおよびC ++バインディング

Encoding_RS用のFFIレイヤーは、別のクレートとして利用できます。クレートには、C ++標準ライブラリとGSLタイプを使用して、デモC ++ラッパーが付属しています。

memモジュールのバインディングは、encoding_c_memクレートにあります。

Geckoコンテキストでは、MFBT/XPCOMタイプを使用したC ++ラッパーがあります。

C ++ラッパーについての記事があります。

サンプルプログラム

さび
c
C ++

オプションの機能

現在、これらのオプションの貨物機能があります。

`simd-accel`

夜間に依存するportable_simd標準ライブラリ機能を使用して、SIMDアクセラレーションを有効にします。

これは、この機能を有効にすることで、将来のコンパイラが古いコードをコンパイルするというRustの保証からオプトアウトされるため、オプトイン機能です。

現在、これはこれらのターゲットを除いて改善とは言われておらず、 simd-accel機能が他のターゲットでビルドを破ることが期待されています。

x86_64
I686
aarch64
thumbv7neon

毎晩のRustを使用する場合、最初のコンポーネントが上記の1つであるターゲットを使用し、 Rustを更新するときに構成を修正する準備ができているため、この機能を有効にする必要があります。それ以外の場合は、この機能を有効にしないでください。

Firefoxが使用します。

`serde`

Serdeを使用して、シリアル化と脱派のサポート&'static Encoding型構造フィールドを有効にします。

Firefoxで使用されていません。

`fast-legacy-encode`

最速のレガシーエンコードオプションを有効にするためのキャッチオプション。デコード速度やUTF-8エンコード速度には影響しません。

現在、このオプションは、次のオプションを有効にすることと同等です。

fast-hangul-encode
fast-hanja-encode
fast-kanji-encode
fast-gb-hanzi-encode
fast-big5-hanzi-encode

バイナリサイズに176 kbを追加します。

Firefoxで使用されていません。

`fast-hangul-encode`

デコードの最適化されたテーブル上のバイナリ検索から、韓国のプレーンテキストをこのオプションなしで約4倍速くエンコードすることにより、デコード最適化テーブル上のバイナリ検索からルックアップへのeuc-krにエクサムをエンコードする変更を変更します。

バイナリサイズに20 kbを追加します。

デコード速度には影響しません。

Firefoxで使用されていません。

`fast-hanja-encode`

デコード最適化されたテーブル上の線形検索からインデックスごとのルックアップにhanjaをEUC-krにエンコードすることを変更します。 Hanjaは現代の韓国のテキストでは実質的に存在しないため、このオプションは一般的なケースのパフォーマンスに影響を与えず、EUC-KRにエンコードするために多くのHanjaを意図的に提供する人によって、アプリケーションを回復力のあるAgaistサービスの拒否にしたい場合に主に理にかなっています。

バイナリサイズに40 kbを追加します。

デコード速度には影響しません。

Firefoxで使用されていません。

`fast-kanji-encode`

漢字のshift_jis、euc-jp、およびISO-2022-JPへのエンコードの変更デコード最適化テーブル上の線形検索から、日本のプレーンテキストエンコードを30〜50倍にすることにより、インデックスをインデックスにしてルックアップに移行します（このオプションの約2倍のless-slow-kanji-encodeの速度）。

less-slow-kanji-encodeよりも優先されます。

36 kbをバイナリサイズに追加します（ less-slow-kanji-encodeと比較して24 kb）。

デコード速度には影響しません。

Firefoxで使用されていません。

`less-slow-kanji-encode`

JIS X 0208レベル1の漢字（Shift_jis、EUC-JP、ISO-2022-JPの最も一般的な漢字）は、このオプションなしでは日本のプレーンテキストエンコードを14〜23倍速くエンコードします。

バイナリサイズに12 kbを追加します。

デコード速度には影響しません。

Firefoxで使用されていません。

`fast-gb-hanzi-encode`

CJK統一されたアイドラフでのHANZIのエンコーディングの変更は、デコード最適化テーブルの線形検索からGBKおよびGB18030にブロックされ、その後、デコード最適化テーブルの別の部分のバイナリ検索がインデックスを作成してルックアップして、100から100から100までのエンコードに100から、100回まで（2.5回のように、100回まで100個から、100回までのレガーエンコードを作成します。 less-slow-gb-hanzi-encode ）。

less-slow-gb-hanzi-encodeよりも優先されます。

36 kbをバイナリサイズに追加します（ less-slow-gb-hanzi-encodeと比較して24 kb）。

デコード速度には影響しません。

Firefoxで使用されていません。

`less-slow-gb-hanzi-encode`

GB2312レベル1のHANZI（GB18030およびGBKで最も一般的な漢字）は、このオプションがなければ、レガシーエンコードの約40倍のレガシーエンコーディングに簡素化された中国のプレーンテキストエンコードを低速にします（線形検索の代わりにバイナリ検索）エンコードをエンコードします。

バイナリサイズに12 kbを追加します。

デコード速度には影響しません。

Firefoxで使用されていません。

`fast-big5-hanzi-encode`

CJK統一されたアイデロググラフにおけるハンジのエンコードの変更は、デコード最適化テーブルの線形検索から、インデックスを使用することでless-slow-big5-hanzi-encodeに移動するBig5にブロックされます。

less-slow-big5-hanzi-encodeよりも優先されます。

バイナリサイズに40 kbを追加します（ less-slow-big5-hanzi-encodeと比較して20 kb）。

デコード速度には影響しません。

Firefoxで使用されていません。

`less-slow-big5-hanzi-encode`

Big5レベル1のHanzi（Big5で最も一般的なHanzi）は、このオプションがなければ、従来の中国のプレーンテキストエンコードをBIG5に約36倍速くすることが少なくなります（リニア検索の代わりにバイナリ検索）エンコードが少なくなります。

バイナリサイズに20 kbを追加します。

デコード速度には影響しません。

Firefoxで使用されていません。

パフォーマンスの目標

UTF-16へのデコードの場合、目標は少なくともGeckoの古いUCONVと同様に実行することです。 UTF-8へのデコードの場合、目標は少なくとも錆びを実行することです。これらの目標は達成されました。

UTF-8へのエンコードは速いはずです。（UTF-8からUTF-8エンコードは、 memcpyおよびUTF-16からUTF-8に相当する必要があります。）

レガシーエンコーディングにエンコードすると、スピードはノンゴールです。デフォルトでは、レガシーエンコーディングへのエンコーディングは、ヤモリのフォームの提出とURLの解析が実際の使用であまりにも遅すぎない限り、コードサイズを犠牲にして速度で最適化されるべきではありません。

バイナリサイズのために、デフォルトでは、エンコード_RSには、単一バイトエンコードごとに32ビットのエンコード固有のデータを超えるエンコード固有のデータテーブルがありません。したがって、エンコーダーはデコード最適化されたデータテーブルを検索します。これは、ほとんどの場合、線形検索です。その結果、デフォルトでは、レガシーのエンコードへのエンコードは、他のライブラリと比較して、遅い状態から非常に遅いまでさまざまです。それでも、現実的な作業の負荷があるため、これはWeb露出したエンコーダーユースケースのRaspberry Pi 3（テスト用の電話のために立つ）でユーザーが魅力的に遅くならないほど速く見えました。

オプションでCJKレガシーを高速にするために、上記の貨物機能を参照してください。

パフォーマンスを測定するためのフレームワークは個別に利用できます。

さびバージョンの互換性

最新の安定した錆、最新の毎晩の錆、そして毎晩Firefoxに使用される錆のバージョンをサポートすることは目標です。

現時点では、Firefoxが必要とするものよりも古いバージョンをサポートするという確固たるコミットメントはありません。MSRVの変化をSemver-breakingとして扱うというコミットメントはありません。このクレートはcfg-ifに依存しているため、MSRVの変化をSemver-Breakingとして扱わないように見えるため、このクレートはSemver-Breakingとして治療することは役に立たないでしょう。

2024-11-01の時点で、MSRVはクレートには錆びた1.40.0であると思われ、Global Allocatorについてのエラーなしに通過するためにDOCテストに1.42.0を使用しています。 simd-accel機能により、MSRVはさらに高くなっています。

さびエンコードとの互換性

エンコーディング_RSの上に錆をコードするAPIを実装する互換性レイヤーは、別のクレートとして提供されます（crates.ioにアップロードすることはできません）。互換性レイヤーはもともと、Firefoxがそれを必要とするという相殺で書かれていましたが、現在Firefoxでは使用されていません。

生成されたコードを再生します

生成されたコードを再生するには：

Python 2をインストールしてください。
clone https://github.com/hsivonen/encoding_c encoding_rsディレクトリの横にあります。
クローンhttps://github.com/hsivonen/codepage encoding_rsディレクトリの横にあります。
clone https://github.com/whatwg/encoding encoding_rsディレクトリの横にあります。
チェックアウトリビジョン1d519bf8e5555cef64cf3a712485f41cd1a6a990のencodingリポジトリ。（注： f381389 、 encodingレポライセンス変更の前から使用されたencodingの改訂でした。）
encoding_rsディレクトリをワーキングディレクトリとして、 python generate-encoding-data.pyを実行します。

ロードマップ

ノートをリリースします

0.8.35

GB18030-2022の変更を実装します。（これが理論の破壊的な変化であると主張できたとしても、実際には実践のセンバーの休憩として扱われていません。）

0.8.34

packed_simd Crateの代わりに、標準ライブラリのportable_simdの毎晩機能を使用します。 simd-accelオプションの夜間機能にのみ影響します。
unsafeに関する内部ドキュメントの改善とマイナーなコードの改善。
Cargo.tomlにrust-versionを追加しました。

0.8.33

packed_simd_2の代わりにpacked_simd使用してください。これにより、更新がpacked_simd名の下に戻ってきました。 simd-accelオプションの夜間機能にのみ影響します。

0.8.32

build.rsを削除しました。（この除去は、いくつかのウイルス対策製品によって報告された誤検知を解決するはずです。これにより、将来のビルドの破損に対する錆の保証をオプトアウトしたビルド構成が破損する可能性があります。）
SIMDベクターのレーン構成を再解釈するために使用されるAPIの内部変更。
ドキュメントの改善。

0.8.31

crates.ioが括弧をサポートしている今、括弧付きのSPDXを使用します。

0.8.30

ライセンス情報を更新して、WhatWGデータライセンスの変更を考慮してください。

0.8.29

アロケーターを使用する部品をオプションにします。

0.8.28

no_stdサポートの一部として導入されたSerdeサポートのエラーを修正します。

0.8.27

no_std環境でクレートを動作させます（ allocを使用）。

0.8.26

simd-accel機能を破った2018年版の移行の監視を修正しました。

0.8.25

ポインターアライメントは、中間ステップが定義されていないようにチェックされます。
packed_simd依存関係をpacked_simd_2に更新します。
cfg-if依存関係を1.0に更新します。
途中で新しい錆バージョンによって導入された警告に対処します。
1.0 cfg-if 、2018年に更新されます。

0.8.24

ポインターアライメントを計算する際に未定義の動作として指定された方法で、中間（再参考ではない）ポインター値を計算しないでください。

0.8.23

著作権通知から年を削除します。（機能やバグの修正はありません。）

0.8.22

フォーマット修正と新しいユニットテスト。（機能やバグの修正はありません。）

0.8.21

ストリームの最後に無効なUTF-16 [BE | LE]入力を使用したパニックを修正しました。

0.8.20

Decoder::latin1_byte_compatible_up_toは、そのメソッドを実際に便利にするために、それ以上の場合にNoneに戻します。これは、バグ修正のセマンティクスの変化による壊れた変化であると主張することができますが、とにかく合理的な方法でなしケースを処理しなければならNoneた発信者を破ることはありません。

0.8.19

convert_str_to_utf16のバインドチェックの束を削除しました。
mem::convert_utf8_to_utf16_without_replacementを追加しました。

0.8.18

mem::utf8_latin1_up_toとmem::str_latin1_up_toを追加しました。
Decoder::latin1_byte_compatible_up_toを追加しました。

0.8.17

bincode （DEV依存関係）バージョンの要件を1.0に更新します。

0.8.16

simdクレートからpacked_simdに切り替えます。

0.8.15

simd-accel （READMEのみのリリース）のドキュメントを調整します。

0.8.14

UTF-16からUTF-8エンコード変換を可能な限り密接に充填します。

0.8.13

UTF-8からUTF-16デコーダーを作成しました。右のスライスの長さ（出力スライス）と記述されたコード単位の数を比較して、0.8.11に導入されたパニックを修正しました。

0.8.12

Clippy Lint名からclippy::プレフィックスを削除しました。

0.8.11

最小錆の要件を1.29.0に変更しました（別のstatic定義するときにstaticの内部を参照する機能について）。
他のデータの1つのキャッシュラインを解放することを期待して、シングルバイトエンコーディングのルックアップテーブルとUTF-8をキャッシュラインに明示的に整列させました。（おそらくテーブルはすでに揃っていて、これはプラセボです。）
単一バイトエンコードごとに32ビットのエンコード指向データを追加しました。この変更は、非Latin1イッシュラテンのラテンレガシーエンコーディングのパフォーマンス中立であり、ラテン語とアラビア語のレガシーエンコード速度の改善が多少多少速度（ドイツ語の場合は2.4倍、ポルトガル語では2.3倍、フランス語では1.4x）、および非latin1の改善されていないlegの単一legをエンコードしてください（5.2xの場合は5.xの場合は、ロシア語、ヘブライ語の4倍）。
高速CJKレガシーエンコードオプションのコンパイル時間オプションが追加されました（バイナリサイズ（最大176 kb）とランタイムメモリ使用量のコストで）。これらのオプションは、CJKエンコーダーを完全に書き換える代わりに、全体的なコード構造を保持しているため、さらに多くのメモリを使用してバイナリを作成することで達成できるものほど速度が良くありません。
UTF-8デコードと検証をより速くしました。
Encodingに追加されたメソッドis_single_byte() 。
mem::decode_latin1()およびmem::encode_latin1_lossy()を追加しました。

0.8.10

テストされているアサーションが無効になっているときにパニック状態をテストする単体テストを無効にしました。

0.8.9

Made --features simd-accel Stable-Channelコンパイラと連携してFirefoxビルドシステムを簡素化します。

0.8.8

is_foo_bidi()をu+feff（ゼロ幅なしのブレイクスペース、別名バイトオーダーマーク）と左への右に扱わないようにしました。
is_foo_bidi()関数は、入力にヘブライ語のプレゼンテーションフォーム（左への右）が含まれている場合にtrueを報告します。

0.8.7

UTF-8にデコードするときに、UTF-16LE/UTF-16BEデコーダーのパニックを修正しました。

0.8.6

convert_utf16_to_latin1_lossyからバージョン0.8.5に追加されたデバッグアサーションを一時的に削除しました。

0.8.5

デバッグアサーションが有効になっているがファジングが有効になっていない場合、 memモジュールのLATIN1への紛失した変換は、入力がU+0000 ... U+00FF（包括的）の範囲にあると主張します。
memモジュールでは、不十分な出力スペースに対処できるLATIN1およびUTF-16からUTF-8への変換を提供します。アイデアは、Jemallocバケットサイズに丸められた割り当てで最初にそれらを使用し、Jemallocの丸みが最初の推測として不十分である場合にのみ、最悪の割り当てを行うことです。

0.8.4

memモジュールのUTF-16とLATIN1の間の変換でバージョン0.8.1で導入されたSSE2固有のsimd-accel固有のメモリ破損を修正します。

0.8.3

リリース用ではない#[inline(never)]注釈を削除しました。

0.8.2

UTF-8に非ASCII UTF-16を作成し、バウンドチェックを手動で省略し、手動でブランチ予測注釈を追加することにより、より速くエンコードします。

0.8.1

memモジュールのUTF-16とLATIN1の間のSSE2変換のための微調整されたループの展開とメモリアラインメントは、長いバッファーを変換するときにパフォーマンスを向上させます。

0.8.0

Rustの最小サポートバージョンを1.21.0に変更しました（SEMVER BREAKE CHANGE）。
漢字と漢のレガシーエンコードのサイズとスピードトレードオフを制御するためのデフォルトとオプションの機能を反転しました（Semver Breaking Change）。
ARMV7にネオンサポートを追加しました。
simd-accelerated x-user定義されたUTF-16デコード。
UTF-16LEおよびUTF-16BEをより速くデコードしました（SIMD加速を含む）。

0.7.2

memモジュールを追加します。
memモジュール以外のパフォーマンスに影響を与える可能性のあるSIMDコードをリファクタリングします。

0.7.1

無効なUTF-16からエンコードするときは、U+DC00を正しく処理し、その後に別の低い代理を処理します。

0.7.0

replacement交換エンコードのラベルにします。（仕様の変更。）
Encoding::for_name()を削除します。（ Encoding::for_label(foo).unwrap()は、上記のラベルが変更された後、十分に近づいています。）
parallel-utf8貨物機能を削除します。
&'static EncodingのオプションのSerdeサポートを追加します。
ASCII処理のパフォーマンスの調整。
UTF-8検証のパフォーマンスの調整。
Aarch64でのSIMDサポート。

0.6.11

Encoder::has_pending_state() publicを作成します。
simdクレートの依存関係を0.2.0に更新します。

0.6.10

ISO-2022-JPにエンコードするときは、NCRのための十分なスペースを予約します。
マルチバイトデコーダーの最大長さの正しい計算。
BOMスニッフィングが実行される前の正しい最大長の計算が行われます。
UTF-16からGBKにエンコードするときに最大長を正しく計算します。

0.6.9

GB18030レンジデコードが失敗した場合、何もプレップしないでください。（仕様の変更。）

0.6.8

最初のバッファに潜在的に部分的なBOMが含まれ、次のバッファが最後のバッファーが含まれている場合をcorrecly処理します。
ISO-2022-JPでバイト7Fを正しくデコードします。
UTF-16をUTF-8エンコードにして、バッファーの端に近づけます。
EncodingにHashを実装します。

0.6.7

ISO-2022-JPエンコーダーの半幅のカタカナを完全な幅のカタナにマップします。（仕様の変更。）
交換用のエンコード時にOutputFullよりもInputEmptyの正しい優先順位を与え、渡された出力バッファーが短すぎるか、出力バッファーの残りのスペースが交換後に小さすぎます。

0.6.6

部分的なBOMプレフィックスがデコーダーの状態の一部である場合、最大長さの計算。

0.6.5

さまざまなエンコーダーの最大長さの計算を正しい。
UTF-16デコーダーの最大長さの計算を正しい。
CoderResult 、 DecoderResult 、およびEncoderResultタイプのPartialEqとEqを導き出します。

0.6.4

交換でエンコードするときはパニックを避け、宛先バッファーが短すぎて1つの数値文字参照を保持できません。

0.6.3

32ビットの大手ホストのサポートを追加します。（今回は本当です。）

0.6.2

Encoder::encode_from_utf16の不良インデックスを使用したサブスライシングからのパニックを修正します。（監視のために、 Encoder::encode_from_utf8既に持っていた修正がありませんでした。）
非ストリーミングケースでのエラーステータスの蓄積をマイクロプチミス化します。

0.6.1

実際に起こる可能性が低い場合、整数のオーバーフロー近くのパニックを避けてください。
Clippy Lintsをアドレスします。

0.6.0

最悪のバッファーサイズの要件を計算する方法を作成します。整数のオーバーフローをチェックします。
レーヨンを0.7.0にアップグレードします。

0.5.1

より良いドキュメントの読みやすさのためのメソッドを並べ替えます。
ビッグエンディアンホストのサポートを追加します。（実際にテストされたのは64ビットケースのみです。）
x86_64ではなく、32ビットアームのALU（非SIMD）ケースを最適化します。

0.5.0

非ストリーミングデコードに過度に長いバッファーを割り当てないでください。
出力バッファーの端近くのISO-2022-JPおよび交換用デコーダーの動作を修正します。
結果構造に#[must_use]で注釈を付けます。

0.4.0

FFIを別の木枠に分割します。
パフォーマンスの調整。
CJKバイナリサイズとエンコードパフォーマンスの変更。
長いバッファーの場合のUTF-8検証を並列化します（オプションの特徴parallel-utf8を使用）。
可能であればISO-2022-JPでも借ります。

0.3.2

ALUベースのASCII加速における移動ポインターを修正します。
ドキュメントのエラーを修正し、ドキュメントを改善します。

0.3.1

0xeeから始まるバイトシーケンスのUTF-8からUTF-16デコードを修正します。
機能simd-accelを使用すると、UTF-8をUTF-8にデコードします。
非ストリーミングAPIを使用してASCII互換のエンコードからのASCII-ONLY入力をデコードおよびエンコードする場合、入力の借入を返します。
UTF-16からUTF-8へのエンコードをより速くします。

0.3

constからstaticへのEncodingのインスタンスへの参照を変更して、referentsを使用する木枠を越えて指示対象を一意にするようにします。
Encodingの非参照型FOO_INITインスタンスを導入して、外国のクレートが&'static Encodingタイプのstaticの統計を備えた&'static Encodingアレイアイテムの初期化を禁止するrustの制約の下でさえ、 Encodingインスタンスへの参照を持つ静的配列を初期化できるようにstatics 。
クロスクレートの使用が指示対象を一意に保つように、錆の使用が機能constて機能する場合、上記の2つのポイントが戻ることを文書化します。
エンコードとデコードのために錆のみの非ストリーミング方法からCowを返します。
Encoding::for_bom() bomの長さを返します。
UTF-16LE、UTF-16BE、ISO-2022-JPおよびXユーザー定義以外のエンコーディングのASCII-Accelerated変換。
simd-accel機能フラグの後ろにSSE2アクセラレーションを追加します。（毎晩の錆が必要です。）
長い偽のラベルでパニックを修正します。
Windows-1255の0xcaからU+05BAへのマップ。（仕様の変更。）
shift_jis eudc範囲の終わりを修正します。（仕様の変更。）

0.2.4

ポーランドのFFIドキュメント。

0.2.3

UTF-16をUTF-8エンコードに修正します。

0.2.2

Encoder.encode_from_utf8_to_vec_without_replacement()を追加します。

0.2.1

Encoding.is_ascii_compatible()を追加します。
Encoding::for_bom()を追加します。
== Encodingの場合は、ポインター比較の代わりに名前の比較を使用します。これは、異なるクレートのエンコード定数の使用が異なるアドレスをもたらし、定数を他のことを壊さずに静的に変えることはできないためです。

0.2.0

最初のリリース。

拡大する

追加情報

バージョン 1.0.0
タイプウェブサイトデータ
更新時間 2025-07-04
サイズ 1.34MB
から Github

encoding_rs

encoding_rs

機能

std::ioとの統合

no_std環境

電子メールの解読

Windowsコードページ識別子マッピング

DOSエンコーディング

エンコーダーのテキストの準備

ライセンス

ドキュメント

CおよびC ++バインディング

サンプルプログラム

オプションの機能

simd-accel

serde

fast-legacy-encode

fast-hangul-encode

fast-hanja-encode

fast-kanji-encode

less-slow-kanji-encode

fast-gb-hanzi-encode

less-slow-gb-hanzi-encode

fast-big5-hanzi-encode

less-slow-big5-hanzi-encode

パフォーマンスの目標

さびバージョンの互換性

さびエンコードとの互換性

生成されたコードを再生します

ロードマップ

ノートをリリースします

0.8.35

0.8.34

0.8.33

0.8.32

0.8.31

0.8.30

0.8.29

0.8.28

0.8.27

0.8.26

0.8.25

0.8.24

0.8.23

0.8.22

0.8.21

0.8.20

0.8.19

0.8.18

0.8.17

0.8.16

0.8.15

0.8.14

0.8.13

0.8.12

0.8.11

0.8.10

0.8.9

0.8.8

0.8.7

0.8.6

0.8.5

0.8.4

0.8.3

0.8.2

0.8.1

0.8.0

0.7.2

0.7.1

0.7.0

0.6.11

0.6.10

0.6.9

0.6.8

0.6.7

0.6.6

0.6.5

0.6.4

0.6.3

0.6.2

`std::io`との統合

`no_std`環境

`simd-accel`

`serde`

`fast-legacy-encode`

`fast-hangul-encode`

`fast-hanja-encode`

`fast-kanji-encode`

`less-slow-kanji-encode`

`fast-gb-hanzi-encode`

`less-slow-gb-hanzi-encode`

`fast-big5-hanzi-encode`

`less-slow-big5-hanzi-encode`