生存時間は、生存だけでなく、あらゆる種類のイベントまでの時間データに対して統計学者が使用する用語です。 たとえば、学生の場合は卒業までの時間、夫婦の場合は離婚までの時間などです。 このような変数の重要な点は、それらが打ち切られていることです。 言い換えれば、あなたは通常、完全な情報を持っていません。 最も一般的なタイプの打ち切りは「右打ち切り」です。 これは、問題のイベントがサンプル内のすべてのサブジェクトに発生しない場合に発生します。 たとえば、学生を追跡している場合、研究が終了する前にすべてが卒業するわけではありません。 彼らが卒業するかどうか、いつ卒業するかはわかりません。
サンプル内のすべての被験者の生存時間をリストします。 たとえば、5人の学生がいて(実際の研究ではもっと多くの学生がいるでしょう)、卒業までの時間は 3年、4年(これまで)、4。5年、3。5年、7年(これまで)、時間を書き留めます:3、4、4.5、3.5、 7.
右打ち切りされた時間(つまり、イベントがまだ発生していない時間)の横にプラス記号(または他のマーク)を付けます。 リストは次のようになります:3、4 +、4.5、3.5、7 +。
データの半分以上が打ち切られているかどうかを判断します。 これを行うには、プラス記号(打ち切りデータ)のある被験者の数を被験者の総数で割ります。 これが0.5を超える場合、中央値は存在しません。 この例では、5人中2人の被験者がデータを打ち切りました。 それは半分未満なので、中央値が存在します。
生存時間を最短から最長に並べ替えます。 例を使用すると、3、3.5、4、4.5、7のように並べ替えられます。
被験者数を2で割り、切り捨てます。 例では、5÷2 = 2.5であり、切り捨てると2になります。
この数値よりも大きい一次生存時間を見つけます。 これは生存期間の中央値です。 この例では、4は他の2つの数値よりも大きい最初の数値です。 これは生存期間の中央値です。