今日、現代の生活のほぼすべての側面には、個人間または個々のサーバーやシステム間でのデジタル情報の転送が含まれます。 オンラインで銀行口座を管理する場合は、ソーシャルメディアページを更新したり、DVDプレーヤーを接続してDVDを再生したりすることもできます。 テレビでは、情報はコードまたはワイヤレスを介して、ある場所から別の場所にデジタルで移動します 信号。 この情報をある場所から別の場所に渡すには、コンピューターコードを介して情報を転送する必要があります。 この「言語」では、情報は1と0の組み合わせを介して移動します。これはバイナリコードと呼ばれます。 あるシステムから別のシステムに移動するバイナリコードのエラーは、情報が適切に伝達されないことを意味する可能性があり、コンピュータユーザーに多くの問題を引き起こす可能性があります。 ハミング距離は、コードの違いを理解する方法です。 その後、これを使用してエラーを修正できます。
TL; DR(長すぎる; 読んでいない)
ハミング距離とは、2行のコードが異なるスポットの数を単純に合計することによって決定される、2行のバイナリコードが異なるポイントの数を指します。 たとえば、2つのコードワード10101010と01011010の間の距離は4です。これは、コンテキストがなければあまり意味がないかもしれませんが、4つのポイントで次のことを意味する可能性があります。 コードのエラーにより、オーディオファイルが正しく再生されなかったり、テレビのビジュアルが正しく表示されなかったり、重要なコンピュータ機能が 誤解されています。
ハミング距離とは何ですか?
与えられた2行のコードのハミング距離は、行のバイナリコード値が異なるポイントの数です(2行のコードが同じ長さであると想定)。 これは、最初のパスで理解するのが少し混乱する可能性があるため、次の簡単な例を検討してください。1ワードのテキストメッセージが電話Aから電話Bに送信されます。 バイナリコードに変換すると、電話Aのテキストメッセージを表すコード行は「101」になり、電話Bのコード行は「101」になります。 コード行には「010」と表示されます。 これらの線を比較すると、3つのスポットのそれぞれに異なるシンボルがあることがわかります。 これは、メッセージが正しく送信されなかったことを示している可能性があります。
ハミング距離の計算方法
単純なシナリオでは、ハミング距離の計算は簡単ですが、ハミング距離は同じ長さの線に対してのみ計算できることを覚えておくことが重要です。 線の値が異なるスポットの数を合計するだけです。 上記の例では、3つのスポットで線の値が異なるため、ハミング距離は3になります。 ただし、この比較を行うには、バイナリコードの行が長くなるほど時間がかかります。 100110と110011の2行のコードを含む、少し長い例を考えてみましょう。 これらのコード行には、両方とも6つの情報ポイントが含まれています。 これらの3つのポイントで値が異なるため、これら2つの線の間のハミング距離も3になります。 より多くのデータセットを使用したハミング距離の計算はより複雑になり、d = min {d(x、y):x、y∈C、x≠y}のような複雑な方程式や関数を使用する必要があります。
ハミング距離が役立つのはなぜですか?
文脈から外れて、ハミング距離は恣意的に見えるかもしれません。 ただし、これはコーダーにとって重要な測定値です。 ハミング距離は、コーダーがエラーを検出し、それらのエラーを独自に修正するコードを作成するのに役立ちます。 また、コードがエラーを起こしやすいことを人々が理解するのにも役立ちます。 ハミング距離の名前は、1940年代後半にベル研究所で働いていたときに測定を開発したリチャードウェズリーハミングにちなんで名付けられました。 ハミングはイノベーションのお祝いを軽視していましたが、テクノロジー業界はそれに気づき、コードのトラブルシューティング時に大きな効果を発揮しました。 ハミングが測定値を発見してから約50年後、1996年にドイツのEduard RheimFoundationからEduardRheim Award for Achievement inTechnologyを授与されました。 さらに、テクノロジーセクターの大規模な専門組織であるI.E.E.E.は、毎年恒例のRichardWを配布しています。 彼に敬意を表してハミングメダル。