Utama Lain Analisis Data Waktu-Ke-Acara

Analisis Data Waktu-Ke-Acara

Gambaran

Perangkat lunak

Deskripsi

Situs web

Bacaan

Kursus

Gambaran

Halaman ini menjelaskan secara singkat serangkaian pertanyaan yang harus dipertimbangkan ketika menganalisis data waktu-ke-peristiwa dan menyediakan daftar sumber daya beranotasi untuk informasi lebih lanjut.

Deskripsi

Apa yang unik dari data time-to-event (TTE)?

Data time-to-event (TTE) unik karena hasil yang menarik tidak hanya apakah suatu peristiwa terjadi atau tidak, tetapi juga kapan peristiwa itu terjadi. Metode tradisional regresi logistik dan linier tidak cocok untuk dapat memasukkan aspek peristiwa dan waktu sebagai hasil dalam model. Metode regresi tradisional juga tidak dilengkapi untuk menangani penyensoran, jenis khusus dari data yang hilang yang terjadi dalam analisis waktu-ke-peristiwa ketika subjek tidak mengalami peristiwa yang menarik selama waktu tindak lanjut. Di hadapan penyensoran, waktu sebenarnya untuk acara diremehkan. Teknik khusus untuk data TTE, seperti yang akan dibahas di bawah, telah dikembangkan untuk memanfaatkan informasi parsial pada setiap subjek dengan data yang disensor dan memberikan perkiraan kelangsungan hidup yang tidak bias. Teknik-teknik ini menggabungkan data dari beberapa titik waktu di seluruh mata pelajaran dan dapat digunakan untuk menghitung tarif, rasio waktu, dan rasio bahaya secara langsung.

Apa pertimbangan metodologis penting dari data waktu-ke-peristiwa?

Ada 4 pertimbangan metodologis utama dalam analisis time to event atau data survival. Penting untuk memiliki definisi yang jelas tentang target acara, asal waktu, skala waktu, dan untuk menggambarkan bagaimana peserta akan keluar dari penelitian. Setelah ini didefinisikan dengan baik, maka analisis menjadi lebih lurus ke depan. Biasanya ada satu peristiwa target, tetapi ada perluasan analisis kelangsungan hidup yang memungkinkan beberapa peristiwa atau peristiwa berulang.

Apa asal waktu?

Asal waktu adalah titik di mana waktu tindak lanjut dimulai. Data TTE dapat menggunakan berbagai asal waktu yang sebagian besar ditentukan oleh desain studi, masing-masing memiliki kelebihan dan kekurangan terkait. Contohnya termasuk waktu dasar atau usia dasar. Asal waktu juga dapat ditentukan oleh karakteristik yang menentukan, seperti onset paparan atau diagnosis. Ini sering merupakan pilihan alami jika hasilnya terkait dengan karakteristik itu. Contoh lain termasuk kelahiran dan tahun kalender. Untuk studi kohort, skala waktu paling sering adalah waktu belajar.

Apakah ada pilihan lain untuk skala waktu selain waktu belajar?

Usia adalah skala waktu lain yang umum digunakan, di mana usia dasar adalah asal waktu dan individu keluar pada acara atau menyensor usia mereka. Model dengan usia sebagai skala waktu dapat disesuaikan untuk efek kalender. Beberapa penulis merekomendasikan bahwa usia daripada waktu belajar digunakan sebagai skala waktu karena dapat memberikan perkiraan yang kurang bias.

Apa itu penyensoran?

Salah satu tantangan khusus untuk analisis kelangsungan hidup adalah bahwa hanya beberapa individu yang akan mengalami peristiwa tersebut pada akhir penelitian, dan oleh karena itu waktu kelangsungan hidup tidak akan diketahui untuk subset dari kelompok penelitian. Fenomena ini disebut penyensoran dan dapat muncul dengan cara berikut: peserta penelitian belum mengalami hasil yang relevan, seperti kekambuhan atau kematian, pada akhir penelitian; peserta studi mangkir selama masa studi; atau, peserta studi mengalami peristiwa berbeda yang membuat tindak lanjut lebih lanjut tidak mungkin dilakukan. Waktu interval yang disensor seperti itu meremehkan waktu kejadian yang sebenarnya tetapi tidak diketahui. Untuk sebagian besar pendekatan analitik, penyensoran dianggap acak atau tidak informatif.

Ada tiga jenis utama penyensoran, kanan, kiri, dan interval. Jika peristiwa terjadi di luar akhir penelitian, maka data disensor dengan benar. Data yang disensor kiri terjadi saat peristiwa diamati, tetapi waktu peristiwa yang tepat tidak diketahui. Data tersensor interval terjadi pada saat kejadian diamati, tetapi partisipan keluar masuk observasi, sehingga waktu kejadian yang pasti tidak diketahui. Sebagian besar metode analitik kelangsungan hidup dirancang untuk pengamatan dengan sensor kanan, tetapi tersedia metode untuk data interval dan sensor kiri.

Apa pertanyaan minat?

Pilihan alat analisis harus dipandu oleh pertanyaan penelitian yang menarik. Dengan data TTE, pertanyaan penelitian dapat mengambil beberapa bentuk, yang mempengaruhi fungsi kelangsungan hidup mana yang paling relevan dengan pertanyaan penelitian. Tiga jenis pertanyaan penelitian berbeda yang mungkin menarik untuk data TTE meliputi:

  1. Berapa proporsi individu yang akan tetap bebas dari peristiwa setelah waktu tertentu?

  2. Berapa proporsi individu yang akan memiliki acara setelah waktu tertentu?

    kaisar penyakit
  3. Berapakah risiko kejadian pada titik waktu tertentu, di antara mereka yang selamat sampai saat itu?

Masing-masing pertanyaan ini sesuai dengan jenis fungsi yang berbeda yang digunakan dalam analisis kelangsungan hidup:

  1. Fungsi Kelangsungan Hidup, S(t): probabilitas bahwa seorang individu akan bertahan hidup melampaui waktu t [Pr(T>t)]

  2. Fungsi Kerapatan Probabilitas, F(t), atau Fungsi Insidensi Kumulatif, R(t): probabilitas bahwa seorang individu akan memiliki waktu bertahan hidup kurang dari atau sama dengan t [Pr(T≤t)]

  3. Fungsi Bahaya, h(t): potensi sesaat untuk mengalami suatu peristiwa pada waktu t, dengan syarat bertahan sampai saat itu

  4. Fungsi Bahaya Kumulatif, H(t): integral dari fungsi bahaya dari waktu 0 sampai waktu t, yang sama dengan luas daerah di bawah kurva h(t) antara waktu 0 dan waktu t

Jika salah satu dari fungsi ini diketahui, fungsi lainnya dapat dihitung dengan menggunakan rumus berikut:

S(t) = 1 – F(t) Fungsi kelangsungan hidup dan fungsi kepadatan probabilitas berjumlah 1

h(t)=f(t)/S(t) Bahaya sesaat sama dengan probabilitas tak bersyarat dari

mengalami peristiwa pada waktu t, diskalakan dengan fraksi hidup pada waktu t

H(t) = -log[S(t)] Fungsi bahaya kumulatif sama dengan log negatif dari kelangsungan hidup

fungsi

S(t) = e –H(t) Fungsi kelangsungan hidup sama dengan bahaya kumulatif negatif eksponensial

fungsi

Konversi ini sering digunakan dalam metode analisis kelangsungan hidup, seperti yang akan dibahas di bawah ini. Umumnya, peningkatan h(t), bahaya sesaat, akan menyebabkan peningkatan H(t), bahaya kumulatif, yang diterjemahkan menjadi penurunan S(t), fungsi kelangsungan hidup.

Asumsi apa yang harus dibuat untuk menggunakan teknik standar untuk data time-to-event?

Asumsi utama dalam menganalisis data TTE adalah penyensoran non-informatif: individu yang disensor memiliki kemungkinan yang sama untuk mengalami peristiwa berikutnya dengan individu yang tetap berada dalam penelitian. Sensor informatif dianalogikan dengan data hilang yang tidak dapat diabaikan, yang akan membuat analisis menjadi bias. Tidak ada cara pasti untuk menguji apakah penyensoran bersifat non-informatif, meskipun menjelajahi pola penyensoran dapat menunjukkan apakah asumsi penyensoran non-informatif masuk akal. Jika sensor informatif dicurigai, analisis sensitivitas, seperti skenario kasus terbaik dan kasus terburuk, dapat digunakan untuk mencoba mengukur pengaruh sensor informatif terhadap analisis.

Asumsi lain ketika menganalisis data TTE adalah bahwa ada cukup waktu tindak lanjut dan jumlah kejadian untuk kekuatan statistik yang memadai. Ini perlu dipertimbangkan dalam fase desain studi, karena sebagian besar analisis kelangsungan hidup didasarkan pada studi kohort.

Asumsi penyederhanaan tambahan layak disebutkan, karena sering dibuat dalam tinjauan umum analisis kelangsungan hidup. Sementara asumsi ini menyederhanakan model kelangsungan hidup, mereka tidak perlu melakukan analisis dengan data TTE. Teknik lanjutan dapat digunakan jika asumsi ini dilanggar:

  • Tidak ada efek kohort pada kelangsungan hidup: untuk kohort dengan periode perekrutan yang lama, asumsikan bahwa individu yang bergabung lebih awal memiliki kemungkinan bertahan hidup yang sama dengan mereka yang bergabung terlambat

  • Sensor kanan hanya dalam data

  • Peristiwa tidak tergantung satu sama lain

Jenis pendekatan apa yang dapat digunakan untuk analisis kelangsungan hidup?

Ada tiga pendekatan utama untuk menganalisis data TTE: pendekatan non-parametrik, semi-parametrik, dan parametrik. Pilihan pendekatan mana yang akan digunakan harus didorong oleh pertanyaan penelitian yang menarik. Seringkali, lebih dari satu pendekatan dapat digunakan secara tepat dalam analisis yang sama.

Apa pendekatan non-parametrik untuk analisis kelangsungan hidup dan kapan itu tepat?

Pendekatan non-parametrik tidak bergantung pada asumsi tentang bentuk atau bentuk parameter dalam populasi yang mendasarinya. Dalam analisis kelangsungan hidup, pendekatan non-parametrik digunakan untuk menggambarkan data dengan memperkirakan fungsi kelangsungan hidup, S(t), bersama dengan median dan kuartil waktu kelangsungan hidup. Statistik deskriptif ini tidak dapat dihitung secara langsung dari data karena penyensoran, yang meremehkan waktu bertahan hidup yang sebenarnya pada subjek yang disensor, yang menyebabkan perkiraan miring dari rata-rata, median, dan deskriptif lainnya. Pendekatan non-parametrik sering digunakan sebagai langkah pertama dalam analisis untuk menghasilkan statistik deskriptif yang tidak bias, dan sering digunakan bersama dengan pendekatan semi-parametrik atau parametrik.

Pengukur Kaplan-Meier

Pendekatan non-parametrik yang paling umum dalam literatur adalah estimator Kaplan-Meier (atau batas produk). Penaksir Kaplan-Meier bekerja dengan memecah pendugaan S(t) menjadi serangkaian langkah/interval berdasarkan waktu kejadian yang diamati. Pengamatan berkontribusi pada estimasi S(t) sampai peristiwa itu terjadi atau sampai mereka disensor. Untuk setiap interval, probabilitas bertahan sampai akhir interval dihitung, mengingat bahwa subjek berisiko pada awal interval (ini biasanya dinotasikan sebagai pj =( nj – dj)/nj). Estimasi S(t) untuk setiap nilai t sama dengan produk dari bertahannya setiap interval hingga dan termasuk waktu t. Asumsi utama dari metode ini, selain penyensoran non-informatif, adalah bahwa penyensoran terjadi setelah kegagalan dan tidak ada efek kohort pada kelangsungan hidup, sehingga subjek memiliki probabilitas kelangsungan hidup yang sama terlepas dari kapan mereka dipelajari.

Estimasi S(t) dari metode Kaplan-Meier dapat diplot sebagai fungsi bertahap dengan waktu pada sumbu X. Plot ini adalah cara yang bagus untuk memvisualisasikan pengalaman bertahan hidup kohort, dan juga dapat digunakan untuk memperkirakan median (ketika S(t)≤0,5) atau kuartil waktu bertahan hidup. Statistik deskriptif ini juga dapat dihitung secara langsung menggunakan estimator Kaplan-Meier. 95% interval kepercayaan (CI) untuk S(t) bergantung pada transformasi S(t) untuk memastikan bahwa 95% CI berada dalam 0 dan 1. Metode yang paling umum dalam literatur adalah estimator Greenwood.

Penaksir Tabel Kehidupan

Penaksir tabel kehidupan dari fungsi kelangsungan hidup adalah salah satu contoh paling awal dari metode statistik terapan, yang telah digunakan selama lebih dari 100 tahun untuk menggambarkan kematian pada populasi besar. Penaksir tabel kehidupan mirip dengan metode Kaplan-Meier, kecuali bahwa interval didasarkan pada waktu kalender dan bukan peristiwa yang diamati. Karena metode tabel kehidupan didasarkan pada interval kalender ini, dan tidak didasarkan pada peristiwa individu/waktu penyensoran, metode ini menggunakan ukuran set risiko rata-rata per interval untuk memperkirakan S(t) dan harus mengasumsikan bahwa penyensoran terjadi secara seragam selama interval waktu kalender. Untuk alasan ini, estimator tabel kehidupan tidak setepat estimator Kaplan-Meier, tetapi hasilnya akan serupa pada sampel yang sangat besar.

apa perbedaan pandemi dan epidemi?

Penaksir Nelson-Aalen

Alternatif lain untuk Kaplan-Meier adalah estimator Nelson-Aalen, yang didasarkan pada penggunaan pendekatan proses penghitungan untuk memperkirakan fungsi bahaya kumulatif, H(t). Estimasi H(t) kemudian dapat digunakan untuk mengestimasi S(t). Estimasi S(t) yang diturunkan dengan menggunakan metode ini akan selalu lebih besar dari estimasi K-M, tetapi perbedaannya akan kecil antara kedua metode dalam sampel yang besar.

Dapatkah pendekatan non-parametrik digunakan untuk analisis univariabel atau multivariabel?

Pendekatan non-parametrik seperti estimator Kaplan-Meier dapat digunakan untuk melakukan analisis univariabel untuk faktor-faktor kategorikal yang diminati. Faktor harus kategoris (baik di alam atau variabel kontinu dipecah ke dalam kategori) karena fungsi kelangsungan hidup, S(t), diperkirakan untuk setiap tingkat variabel kategori dan kemudian dibandingkan di seluruh kelompok ini. Estimasi S(t) untuk setiap kelompok dapat diplot dan dibandingkan secara visual.

Tes berbasis peringkat juga dapat digunakan untuk menguji perbedaan antara kurva kelangsungan hidup secara statistik. Tes ini membandingkan jumlah kejadian yang diamati dan diharapkan pada setiap titik waktu di seluruh kelompok, di bawah hipotesis nol bahwa fungsi kelangsungan hidup adalah sama di seluruh kelompok. Ada beberapa versi tes berbasis peringkat ini, yang berbeda dalam bobot yang diberikan untuk setiap titik waktu dalam perhitungan statistik tes. Dua dari tes berbasis peringkat yang paling umum terlihat dalam literatur adalah tes log rank, yang memberikan bobot yang sama untuk setiap titik waktu, dan tes Wilcoxon, yang menimbang setiap titik waktu dengan jumlah subjek yang berisiko. Berdasarkan bobot ini, tes Wilcoxon lebih sensitif terhadap perbedaan antara kurva di awal tindak lanjut, ketika lebih banyak subjek berisiko. Tes lain, seperti tes Peto-Prentice, menggunakan bobot di antara peringkat log dan tes Wilcoxon. Tes berbasis peringkat tunduk pada asumsi tambahan bahwa penyensoran tidak tergantung pada kelompok, dan semuanya dibatasi oleh sedikit kekuatan untuk mendeteksi perbedaan antar kelompok ketika kurva kelangsungan hidup bersilangan. Meskipun tes ini memberikan nilai-p dari perbedaan antara kurva, mereka tidak dapat digunakan untuk memperkirakan ukuran efek (nilai-p uji peringkat log, bagaimanapun, setara dengan nilai-p untuk faktor kategoris yang menarik dalam Cox univariat model).

Model non-parametrik terbatas karena tidak memberikan perkiraan efek dan umumnya tidak dapat digunakan untuk menilai pengaruh berbagai faktor yang diinginkan (model multivariabel). Untuk alasan ini, pendekatan non-parametrik sering digunakan bersama dengan model semi- atau parametrik penuh dalam epidemiologi, di mana model multivariabel biasanya digunakan untuk mengontrol perancu.

Bisakah kurva Kaplan-Meier disesuaikan?

Merupakan mitos umum bahwa kurva Kaplan-Meier tidak dapat disesuaikan, dan ini sering disebut sebagai alasan untuk menggunakan model parametrik yang dapat menghasilkan kurva kelangsungan hidup yang disesuaikan dengan kovariat. Sebuah metode telah dikembangkan, bagaimanapun, untuk membuat kurva kelangsungan hidup yang disesuaikan menggunakan pembobotan probabilitas terbalik (IPW). Dalam kasus hanya satu kovariat, IPW dapat diestimasi secara non-parametrik dan setara dengan standarisasi langsung kurva kelangsungan hidup pada populasi penelitian. Dalam kasus beberapa kovariat, model semi atau parametrik penuh harus digunakan untuk memperkirakan bobot, yang kemudian digunakan untuk membuat kurva kelangsungan hidup yang disesuaikan dengan banyak kovariat. Keuntungan dari metode ini adalah tidak tunduk pada asumsi proporsional hazard, dapat digunakan untuk kovariat yang bervariasi waktu, dan juga dapat digunakan untuk kovariat kontinu.

Mengapa kita membutuhkan pendekatan parametrik untuk menganalisis data time-to-event?

Pendekatan non-parametrik untuk analisis data TTE digunakan hanya untuk menggambarkan data kelangsungan hidup sehubungan dengan faktor yang diselidiki. Model yang menggunakan pendekatan ini juga disebut sebagai model univariabel. Lebih umum, peneliti tertarik pada hubungan antara beberapa kovariat dan waktu kejadian. Penggunaan model semi dan parametrik penuh memungkinkan waktu untuk menganalisis peristiwa sehubungan dengan banyak faktor secara bersamaan, dan memberikan perkiraan kekuatan efek untuk setiap faktor penyusun.

Apa itu pendekatan semi-parametrik, dan mengapa begitu umum digunakan?

Model Cox Proportional adalah pendekatan multivariabel yang paling umum digunakan untuk menganalisis data kelangsungan hidup dalam penelitian medis. Ini pada dasarnya adalah model regresi waktu-ke-peristiwa, yang menggambarkan hubungan antara kejadian peristiwa, seperti yang dinyatakan oleh fungsi bahaya, dan satu set kovariat. Model Cox ditulis sebagai berikut:

fungsi hazard, h(t) = h0(t)exp{β1X1 + 2X2 + … + pXp}

Ini dianggap sebagai pendekatan semi-parametrik karena model mengandung komponen non-parametrik dan komponen parametrik. Komponen non-parametrik adalah bahaya dasar, h0(t). Ini adalah nilai bahaya ketika semua kovariat sama dengan 0, yang menyoroti pentingnya pemusatan kovariat dalam model untuk interpretasi. Jangan bingung antara bahaya dasar dengan bahaya pada waktu 0. Fungsi bahaya dasar diperkirakan secara non-parametrik, dan tidak seperti kebanyakan model statistik lainnya, waktu kelangsungan hidup tidak diasumsikan mengikuti distribusi statistik tertentu dan bentuk garis dasar bahaya adalah sewenang-wenang. Fungsi bahaya dasar tidak perlu diestimasi untuk membuat kesimpulan tentang bahaya relatif atau rasio bahaya. Fitur ini membuat model Cox lebih kuat daripada pendekatan parametrik karena tidak rentan terhadap kesalahan spesifikasi dari bahaya dasar.

Komponen parametrik terdiri dari vektor kovariat. Vektor kovariat mengalikan bahaya dasar dengan jumlah yang sama terlepas dari waktu, sehingga efek dari setiap kovariat adalah sama setiap saat selama tindak lanjut, dan ini adalah dasar untuk asumsi bahaya proporsional.

Apa yang dimaksud dengan asumsi bahaya proporsional?

Asumsi bahaya proporsional sangat penting untuk penggunaan dan interpretasi model Cox.

Di bawah asumsi ini, ada hubungan konstan antara hasil atau variabel dependen dan vektor kovariat. Implikasi dari asumsi ini adalah bahwa fungsi bahaya untuk dua individu adalah proporsional pada setiap titik waktu dan rasio bahaya tidak berubah terhadap waktu. Dengan kata lain, jika seorang individu memiliki risiko kematian pada beberapa titik waktu awal yang dua kali lebih tinggi dari individu lain, maka pada semua titik waktu kemudian risiko kematian tetap dua kali lebih tinggi. Asumsi ini menyiratkan bahwa kurva bahaya untuk kelompok harus proporsional dan tidak boleh bersilangan. Karena asumsi ini sangat penting, pasti harus diuji.

Bagaimana Anda menguji asumsi proporsional hazard?

Ada berbagai teknik, baik grafis maupun berbasis tes, untuk menilai validitas asumsi bahaya proporsional. Salah satu teknik adalah dengan hanya memplot kurva kelangsungan hidup Kaplan-Meier jika Anda membandingkan dua kelompok tanpa kovariat. Jika kurva bersilangan, asumsi bahaya proporsional dapat dilanggar. Peringatan penting untuk pendekatan ini harus diingat untuk studi kecil. Mungkin ada sejumlah besar kesalahan yang terkait dengan estimasi kurva kelangsungan hidup untuk studi dengan ukuran sampel kecil, oleh karena itu kurva dapat bersilangan bahkan ketika asumsi bahaya proporsional terpenuhi. Plot log-log komplementer adalah tes yang lebih kuat yang memplot logaritma dari logaritma negatif dari fungsi yang diperkirakan selamat terhadap logaritma waktu bertahan hidup. Jika bahaya proporsional antar kelompok, plot ini akan menghasilkan kurva paralel. Metode umum lainnya untuk menguji asumsi bahaya proporsional adalah memasukkan istilah interaksi waktu untuk menentukan apakah HR berubah dari waktu ke waktu, karena waktu sering menjadi penyebab non-proporsionalitas bahaya. Bukti bahwa istilah interaksi kelompok*waktu tidak nol adalah bukti terhadap bahaya proporsional.

Bagaimana jika asumsi proporsional hazard tidak berlaku?

Jika Anda menemukan bahwa asumsi PH tidak berlaku, Anda tidak perlu meninggalkan penggunaan model Cox. Ada pilihan untuk meningkatkan non-proporsionalitas dalam model. Misalnya, Anda dapat menyertakan kovariat lain dalam model, baik kovariat baru, istilah non-linier untuk kovariat yang ada, atau interaksi antar kovariat. Atau Anda dapat membuat stratifikasi analisis pada satu atau lebih variabel. Ini memperkirakan model di mana bahaya dasar diperbolehkan berbeda dalam setiap strata, tetapi efek kovariatnya sama di seluruh strata. Pilihan lain termasuk membagi waktu ke dalam kategori dan menggunakan variabel indikator untuk memungkinkan rasio bahaya bervariasi sepanjang waktu, dan mengubah variabel waktu analisis (misalnya, dari waktu yang telah berlalu ke usia atau sebaliknya).

Bagaimana Anda memeriksa kecocokan model semi-parametrik?

Selain memeriksa pelanggaran asumsi proporsionalitas, ada aspek lain dari model fit yang harus diperiksa. Statistik serupa dengan yang digunakan dalam regresi linier dan logistik dapat diterapkan untuk melakukan tugas-tugas ini untuk model Cox dengan beberapa perbedaan, tetapi ide-ide esensialnya sama di ketiga pengaturan. Penting untuk memeriksa linieritas vektor kovariat, yang dapat dilakukan dengan memeriksa residu, seperti yang kita lakukan dalam regresi linier. Namun, residu dalam data TTE tidak sesederhana seperti dalam regresi linier, sebagian karena nilai hasil tidak diketahui untuk beberapa data, dan residu sering miring. Beberapa jenis residu yang berbeda telah dikembangkan untuk menilai model Cox yang cocok untuk data TTE. Contohnya termasuk Martingale dan Schoenfeld, antara lain. Anda juga dapat melihat residu untuk mengidentifikasi pengamatan yang sangat berpengaruh dan kurang cocok. Ada juga tes kesesuaian yang khusus untuk model Cox, seperti tes Gronnesby dan Borgan, dan indeks prognostik Hosmer dan Lemeshow. Anda juga dapat menggunakan AIC untuk membandingkan model yang berbeda, meskipun penggunaan R2 bermasalah.

Mengapa menggunakan pendekatan parametrik?

Salah satu keuntungan utama model semi-parametrik adalah bahwa bahaya dasar tidak perlu ditentukan untuk memperkirakan rasio bahaya yang menggambarkan perbedaan bahaya relatif antar kelompok. Mungkin, bagaimanapun, estimasi dari bahaya dasar itu sendiri menarik. Dalam hal ini, pendekatan parametrik diperlukan. Dalam pendekatan parametrik, fungsi hazard dan efek kovariat ditentukan. Fungsi bahaya diperkirakan berdasarkan distribusi yang diasumsikan pada populasi yang mendasarinya.

Keuntungan menggunakan pendekatan parametrik untuk analisis kelangsungan hidup adalah:

  • Pendekatan parametrik lebih informatif daripada pendekatan non-parametrik dan semi-parametrik. Selain menghitung perkiraan efek relatif, mereka juga dapat digunakan untuk memprediksi waktu kelangsungan hidup, tingkat bahaya dan waktu kelangsungan hidup rata-rata dan median. Mereka juga dapat digunakan untuk membuat prediksi risiko absolut dari waktu ke waktu dan untuk memplot kurva kelangsungan hidup yang disesuaikan dengan kovariat.

  • Ketika bentuk parametrik ditentukan dengan benar, model parametrik memiliki kekuatan lebih dari model semi-parametrik. Mereka juga lebih efisien, menyebabkan kesalahan standar yang lebih kecil dan perkiraan yang lebih tepat.

  • Pendekatan parametrik bergantung pada kemungkinan maksimum penuh untuk memperkirakan parameter.

  • Residual model parametrik mengambil bentuk umum dari perbedaan yang diamati versus yang diharapkan.

Kerugian utama menggunakan pendekatan parametrik adalah bergantung pada asumsi bahwa distribusi populasi yang mendasari telah ditentukan dengan benar. Model parametrik tidak kuat terhadap kesalahan spesifikasi, itulah sebabnya model semi-parametrik lebih umum dalam literatur dan kurang berisiko untuk digunakan ketika ada ketidakpastian tentang distribusi populasi yang mendasarinya.

Bagaimana Anda memilih bentuk parametrik?

Pilihan bentuk parametrik yang tepat adalah bagian tersulit dari analisis kelangsungan hidup parametrik. Spesifikasi bentuk parametrik harus didorong oleh hipotesis penelitian, bersama dengan pengetahuan sebelumnya dan kemungkinan biologis dari bentuk bahaya dasar. Misalnya, jika diketahui bahwa risiko kematian meningkat secara dramatis setelah operasi dan kemudian menurun dan mendatar, tidak tepat untuk menentukan distribusi eksponensial, yang mengasumsikan bahaya konstan dari waktu ke waktu. Data dapat digunakan untuk menilai apakah formulir yang ditentukan tampaknya sesuai dengan data, tetapi metode berbasis data ini harus melengkapi, bukan menggantikan, pilihan yang didorong oleh hipotesis.

Apa perbedaan antara model bahaya proporsional dan model waktu kegagalan yang dipercepat?

Meskipun model bahaya proporsional Cox adalah semi-parametrik, model bahaya proporsional juga bisa parametrik. Model bahaya proporsional parametrik dapat ditulis sebagai:

h(t,X) = h0(t)exp(Xi ) = h0(t)λ

di mana bahaya baseline, h0(t), hanya bergantung pada waktu, t, tetapi tidak pada X, dan adalah fungsi spesifik unit dari kovariat, yang tidak bergantung pada t, yang menskalakan fungsi bahaya baseline ke atas atau ke bawah. tidak boleh negatif. Dalam model ini, tingkat bahaya adalah fungsi perkalian dari bahaya dasar dan rasio bahaya dapat diinterpretasikan dengan cara yang sama seperti pada model bahaya proporsional semi-parametrik.

Model Accelerated Failure Time (AFT) merupakan kelas model survival parametrik yang dapat dilinearisasi dengan mengambil natural log dari model survival time. Contoh paling sederhana dari model AFT adalah model eksponensial, yang ditulis sebagai:

ln (T) = 0 + 1X1 +…. + pXp + *

Perbedaan utama antara model AFT dan model PH adalah bahwa model AFT mengasumsikan bahwa efek kovariat bersifat multiplikatif pada skala waktu, sedangkan model Cox menggunakan skala bahaya seperti yang ditunjukkan di atas. Estimasi parameter dari model AFT diinterpretasikan sebagai efek pada skala waktu, yang dapat mempercepat atau memperlambat waktu kelangsungan hidup. Exp(β)>1 dari model AFT berarti bahwa faktor tersebut mempercepat waktu kelangsungan hidup, atau mengarah pada kelangsungan hidup yang lebih lama. exp(β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Beberapa distribusi kesalahan dapat ditulis dan diinterpretasikan sebagai model PH dan AFT (mis. eksponensial, Weibull), yang lain hanya PH (mis. Gompertz) atau hanya model AFT (mis. log-logistik) dan yang lainnya bukan model PH atau AFT (yaitu memasang spline).

Bentuk apa yang dapat diasumsikan oleh model parametrik?

Fungsi hazard dapat mengambil bentuk apapun selama h(t)>0 untuk semua nilai t. Sementara pertimbangan utama untuk bentuk parametrik harus pengetahuan sebelumnya tentang bentuk bahaya dasar, setiap distribusi memiliki kelebihan dan kekurangannya sendiri. Beberapa bentuk yang lebih umum akan dijelaskan secara singkat, dengan lebih banyak informasi tersedia di daftar sumber daya.

Distribusi eksponensial

Distribusi eksponensial mengasumsikan bahwa h(t) hanya bergantung pada koefisien model dan kovariat dan konstan sepanjang waktu. Keuntungan utama dari model ini adalah bahwa model ini merupakan model hazard proporsional dan model waktu kegagalan yang dipercepat, sehingga perkiraan efek dapat diinterpretasikan sebagai rasio hazard atau rasio waktu. Kelemahan utama dari model ini adalah bahwa seringkali tidak masuk akal untuk mengasumsikan bahaya konstan dari waktu ke waktu.

Distribusi Weibull

Distribusi Weibull mirip dengan distribusi eksponensial. Sementara distribusi eksponensial mengasumsikan bahaya konstan, distribusi Weibull mengasumsikan bahaya monoton yang dapat meningkat atau menurun tetapi tidak keduanya. Ini memiliki dua parameter. Parameter bentuk (σ ) mengontrol apakah bahaya meningkat (σ1 ) (dalam distribusi eksponensial, parameter ini diatur ke 1). Parameter skala, (1/σ)exp(-β0/σ), menentukan skala kenaikan/penurunan ini. Karena distribusi Weibull disederhanakan menjadi distribusi eksponensial ketika =1, hipotesis nol bahwa =1 dapat diuji menggunakan uji Wald. Keuntungan utama dari model ini adalah model PH dan AFT, sehingga rasio hazard dan rasio waktu dapat diperkirakan. Sekali lagi, kelemahan utama adalah bahwa asumsi monotonisitas dari bahaya dasar mungkin tidak masuk akal dalam beberapa kasus.

Distribusi Gompertz

Distribusi Gompertz merupakan model PH yang sama dengan distribusi log-Weibull, sehingga log dari fungsi hazard linier pada t. Distribusi ini memiliki tingkat kegagalan yang meningkat secara eksponensial, dan seringkali sesuai untuk data aktuaria, karena risiko kematian juga meningkat secara eksponensial dari waktu ke waktu.

Distribusi Log-Logistik

di atas penyihir pelangi oz

Distribusi log-logistik adalah model AFT dengan istilah kesalahan yang mengikuti distribusi logistik standar. Ini bisa cocok dengan bahaya non-monotonik, dan umumnya paling cocok ketika bahaya yang mendasarinya naik ke puncak dan kemudian turun, yang mungkin masuk akal untuk penyakit tertentu seperti TBC. Distribusi log-logistik bukanlah model PH, tetapi merupakan model odds proporsional. Ini berarti tunduk pada asumsi odds proporsional, tetapi keuntungannya adalah koefisien kemiringan dapat diinterpretasikan sebagai rasio waktu dan juga sebagai rasio peluang. Rasio odds 2 dari model log-logistik parametrik, misalnya, akan ditafsirkan sebagai peluang bertahan hidup di luar waktu t di antara subjek dengan x=1 adalah dua kali peluang di antara subjek dengan x=0.

Distribusi Gamma Umum (GG)

Distribusi gamma umum (GG) sebenarnya adalah keluarga distribusi yang berisi hampir semua distribusi yang paling umum digunakan, termasuk distribusi eksponensial, Weibull, log normal, dan gamma. Hal ini memungkinkan untuk perbandingan antara distribusi yang berbeda. Keluarga GG juga mencakup keempat jenis fungsi bahaya yang paling umum, yang membuat distribusi GG sangat berguna karena bentuk fungsi bahaya dapat membantu mengoptimalkan pemilihan model.

Pendekatan Splines

Karena satu-satunya batasan umum dari spesifikasi fungsi bahaya garis dasar adalah bahwa h(t)>0 untuk semua nilai t, splines dapat digunakan untuk fleksibilitas maksimum dalam pemodelan bentuk bahaya garis dasar. Spline kubik terbatas adalah salah satu metode yang baru-baru ini direkomendasikan dalam literatur untuk analisis kelangsungan hidup parametrik karena metode ini memungkinkan fleksibilitas dalam bentuk, tetapi membatasi fungsi menjadi linier di ujung mana data jarang. Splines dapat digunakan untuk meningkatkan estimasi dan juga menguntungkan untuk ekstrapolasi, karena mereka memaksimalkan kesesuaian dengan data yang diamati. Jika ditentukan dengan benar, perkiraan efek dari model yang cocok menggunakan splines tidak boleh bias. Seperti dalam analisis regresi lainnya, tantangan dalam pemasangan splines dapat mencakup pemilihan jumlah dan lokasi simpul dan masalah dengan pemasangan berlebih.

Bagaimana Anda memeriksa kecocokan model parametrik?

Komponen terpenting dalam menilai kecocokan model parametrik adalah memeriksa apakah data mendukung bentuk parametrik yang ditentukan. Hal ini dapat dinilai secara visual dengan membuat grafik bahaya kumulatif berbasis model terhadap fungsi bahaya kumulatif yang diperkirakan Kaplan-Meier. Jika bentuk yang ditentukan benar, grafik harus melalui titik asal dengan kemiringan 1. Uji kecocokan Grønnesby-Borgan juga dapat digunakan untuk mengetahui apakah jumlah kejadian yang diamati berbeda secara signifikan dari jumlah kejadian yang diharapkan. dalam kelompok yang dibedakan berdasarkan skor risiko. Tes ini sangat sensitif terhadap jumlah kelompok yang dipilih, dan cenderung menolak hipotesis nol kecocokan yang memadai terlalu bebas jika banyak kelompok yang dipilih, terutama dalam kumpulan data kecil. Tes tidak memiliki kekuatan untuk mendeteksi pelanggaran model, namun, jika terlalu sedikit kelompok yang dipilih. Untuk alasan ini, tampaknya tidak disarankan untuk mengandalkan uji kesesuaian saja dalam menentukan apakah bentuk parametrik yang ditentukan masuk akal.

AIC juga dapat digunakan untuk membandingkan model yang dijalankan dengan bentuk parametrik yang berbeda, dengan indikasi AIC terendah yang paling sesuai. Namun, AIC tidak dapat digunakan untuk membandingkan model parametrik dan semi-parametrik, karena model parametrik didasarkan pada waktu peristiwa yang diamati dan model semi-parametrik didasarkan pada urutan waktu peristiwa. Sekali lagi, alat-alat ini harus digunakan untuk memeriksa apakah formulir yang ditentukan sesuai dengan data, tetapi masuk akal dari bahaya mendasar yang ditentukan masih merupakan aspek terpenting dalam memilih bentuk parametrik.

Setelah bentuk parametrik yang ditentukan telah ditentukan agar sesuai dengan data dengan baik, metode serupa dengan yang dijelaskan sebelumnya untuk model bahaya semi-proporsional dapat digunakan untuk memilih di antara model yang berbeda, seperti plot residual dan uji kecocokan.

Bagaimana jika prediktor berubah seiring waktu?

Dalam pernyataan model yang ditulis di atas, kami mengasumsikan bahwa eksposur konstan selama masa tindak lanjut. Eksposur dengan nilai yang berubah dari waktu ke waktu, atau kovariat yang bervariasi waktu, dapat dimasukkan dalam model kelangsungan hidup dengan mengubah unit analisis dari individu ke periode waktu ketika eksposur konstan. Ini memecah orang-waktu individu menjadi interval yang setiap orang berkontribusi pada set risiko terpapar dan tidak terpapar untuk kovariat itu. Asumsi utama memasukkan kovariat variatif waktu dengan cara ini adalah bahwa efek kovariat variatif waktu tidak bergantung pada waktu.

Untuk model hazard proporsional Cox, penyertaan kovariat yang berubah terhadap waktu akan berbentuk: h(t) = h0(t)e^β1x1(t). Kovariat yang bervariasi waktu juga dapat dimasukkan dalam model parametrik, meskipun sedikit lebih rumit dan sulit untuk ditafsirkan. Model parametrik juga dapat memodelkan kovariat yang bervariasi waktu menggunakan splines untuk fleksibilitas yang lebih besar.

Umumnya kovariat yang bervariasi waktu harus digunakan ketika dihipotesiskan bahwa bahaya lebih bergantung pada nilai kovariat selanjutnya daripada nilai kovariat pada awal. Tantangan yang muncul dengan kovariat yang bervariasi waktu adalah data yang hilang pada kovariat pada titik waktu yang berbeda, dan potensi bias dalam estimasi bahaya jika kovariat yang bervariasi waktu sebenarnya merupakan mediator.

Apa itu analisis risiko bersaing?

Metode analisis kelangsungan hidup tradisional mengasumsikan bahwa hanya satu jenis peristiwa yang menarik terjadi. Namun, ada metode yang lebih maju untuk memungkinkan penyelidikan beberapa jenis peristiwa dalam studi yang sama, seperti kematian dari berbagai penyebab. Analisis risiko bersaing digunakan untuk studi ini di mana durasi kelangsungan hidup diakhiri dengan yang pertama dari beberapa peristiwa. Diperlukan metode khusus karena menganalisis waktu untuk setiap peristiwa secara terpisah dapat menjadi bias. Khusus dalam konteks ini, metode KM cenderung melebih-lebihkan proporsi subjek yang mengalami peristiwa. Analisis risiko persaingan menggunakan metode kejadian kumulatif, di mana probabilitas kejadian keseluruhan setiap saat adalah jumlah dari probabilitas spesifik kejadian. Model umumnya diterapkan dengan memasukkan setiap peserta studi beberapa kali – satu per jenis acara. Untuk setiap peserta studi, waktu untuk setiap peristiwa disensor pada saat pasien mengalami peristiwa pertama. Untuk informasi lebih lanjut, silakan lihat halaman advancedepidemiology.org di risiko bersaing .

Apa itu model kelemahan dan mengapa mereka berguna untuk data yang berkorelasi?

Data kelangsungan hidup yang berkorelasi dapat muncul karena peristiwa berulang yang dialami oleh seorang individu atau ketika pengamatan dikelompokkan ke dalam kelompok. Entah karena kurangnya pengetahuan atau untuk kelayakan, beberapa kovariat yang terkait dengan peristiwa yang menarik mungkin tidak diukur. Model kelemahan menjelaskan heterogenitas yang disebabkan oleh kovariat yang tidak terukur dengan menambahkan efek acak, yang bertindak secara multiplikasi pada fungsi hazard. Model Frailty pada dasarnya adalah perpanjangan dari model Cox dengan penambahan efek acak. Meskipun ada berbagai skema klasifikasi dan nomenklatur yang digunakan untuk menggambarkan model ini, empat jenis umum model frailty meliputi shared, nested, joint, dan additive frailty.

Apakah ada pendekatan lain untuk menganalisis data kejadian berulang?

Data kejadian berulang dikorelasikan karena beberapa kejadian dapat terjadi dalam subjek yang sama. Sementara model kelemahan adalah salah satu metode untuk memperhitungkan korelasi ini dalam analisis kejadian berulang, pendekatan yang lebih sederhana yang juga dapat menjelaskan korelasi ini adalah penggunaan kesalahan standar yang kuat (SE). Dengan penambahan SE yang kuat, analisis kejadian berulang dapat dilakukan sebagai perpanjangan sederhana dari model semi-parametrik atau parametrik.

Meskipun sederhana untuk diterapkan, ada beberapa cara untuk memodelkan data kejadian berulang menggunakan SE yang kuat. Pendekatan ini berbeda dalam cara mereka mendefinisikan set risiko untuk setiap pengulangan. Dengan cara ini, mereka menjawab pertanyaan penelitian yang sedikit berbeda, sehingga pilihan pendekatan pemodelan mana yang akan digunakan harus didasarkan pada hipotesis penelitian dan validitas asumsi pemodelan.

Proses penghitungan, atau Andersen-Gill, pendekatan untuk pemodelan peristiwa berulang mengasumsikan bahwa setiap pengulangan adalah peristiwa independen, dan tidak memperhitungkan urutan atau jenis peristiwa. Dalam model ini, waktu tindak lanjut untuk setiap mata pelajaran dimulai pada awal penelitian dan dipecah menjadi segmen-segmen yang ditentukan oleh peristiwa (pengulangan). Subjek berkontribusi pada risiko yang ditetapkan untuk suatu peristiwa selama mereka berada di bawah pengamatan pada saat itu (tidak disensor). Model-model ini mudah dipasang sebagai model Cox dengan penambahan penduga SE yang kuat, dan rasio hazard diinterpretasikan sebagai efek kovariat pada tingkat kekambuhan selama periode tindak lanjut. Namun model ini tidak tepat jika asumsi independensi tidak masuk akal.

Pendekatan bersyarat mengasumsikan bahwa subjek tidak berisiko untuk peristiwa berikutnya sampai peristiwa sebelumnya terjadi, dan karenanya mempertimbangkan urutan peristiwa. Mereka cocok menggunakan model bertingkat, dengan nomor kejadian (atau jumlah pengulangan, dalam hal ini), sebagai variabel strata dan termasuk SE yang kuat. Ada dua pendekatan kondisional berbeda yang menggunakan skala waktu berbeda, dan karenanya memiliki set risiko yang berbeda. Pendekatan probabilitas bersyarat menggunakan waktu sejak awal studi untuk menentukan interval waktu, dan sesuai ketika minat berada dalam rangkaian proses kejadian berulang. Pendekatan gap time pada dasarnya mengatur ulang jam untuk setiap pengulangan dengan menggunakan waktu sejak peristiwa sebelumnya untuk menentukan interval waktu, dan lebih tepat ketika perkiraan efek spesifik peristiwa (atau pengulangan) menarik.

Akhirnya, pendekatan marjinal (juga dikenal sebagai pendekatan WLW – Wei, Lin dan Weissfeld –) menganggap setiap peristiwa sebagai proses yang terpisah, sehingga subjek berisiko untuk semua peristiwa sejak awal tindak lanjut, terlepas dari apakah mereka mengalami acara sebelumnya. Model ini sesuai ketika peristiwa dianggap sebagai hasil dari proses dasar yang berbeda, sehingga subjek dapat mengalami peristiwa ketiga, misalnya, tanpa mengalami yang pertama. Meskipun asumsi ini tampaknya tidak masuk akal dengan beberapa jenis data, seperti kekambuhan kanker, asumsi ini dapat digunakan untuk memodelkan kekambuhan cedera selama periode waktu tertentu, ketika subjek dapat mengalami berbagai jenis cedera selama periode waktu yang tidak memiliki urutan alami. Model marginal juga dapat disesuaikan dengan menggunakan model bertingkat dengan SE yang kuat.

Bacaan

Proyek ini bertujuan untuk menggambarkan keputusan metodologis dan analitik yang mungkin dihadapi seseorang ketika bekerja dengan data waktu-ke-peristiwa, tetapi tidak berarti lengkap. Sumber daya disediakan di bawah ini untuk mempelajari lebih dalam topik ini.

Buku Teks & Bab

Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE (2012). Metode Regresi dalam Biostatistik, 2 New York, NY: Springer.

  • Teks pengantar untuk model pengukuran linier, logistik, kelangsungan hidup, dan berulang, paling cocok untuk mereka yang menginginkan titik awal dasar.

  • Bab analisis kelangsungan hidup memberikan gambaran yang baik tetapi tidak mendalam. Contohnya berbasis STATA.

Hosmer DW, Lemeshow S, May S. (2008) Analisis Kelangsungan Hidup Terapan: Pemodelan Regresi Data Time-to-Event, 2nd ed. Hoboken, NJ: John Wiley & Sons, Inc.

  • Tinjauan mendalam tentang model Cox non-parametrik, semi-parametrik, dan parametrik, terbaik bagi mereka yang memiliki pengetahuan di bidang statistik lainnya. Teknik lanjutan tidak dibahas secara mendalam, tetapi referensi ke buku teks khusus lainnya disediakan.

Kleinbaum DG, Klein M (2012). Analisis Kelangsungan Hidup: Sebuah Teks Self-Learning, 3rd ed. New York, NY: Springer Science + Business Media, LLC

  • Teks pengantar yang bagus

Klein JP, Moeschberger ML (2005). Analisis Kelangsungan Hidup: Teknik untuk Data yang Disensor dan Dipotong, 2nd ed. New York, NY: Springer Science + Business Media, LLC

  • dirancang untuk mahasiswa pascasarjana, buku ini memberikan banyak contoh praktis

Therneau TM, Grambsch PM (2000). Pemodelan Data Kelangsungan Hidup: Memperluas Model Cox. New York, NY: Springer Science + Business Media, LLC

  • Pengantar yang baik untuk menghitung pendekatan proses dan menganalisis data kelangsungan hidup yang berkorelasi. Penulis juga menulis paket bertahan hidup di R

Allison PD (2010). Analisis Kelangsungan Hidup Menggunakan SAS: A Practice Guide, 2nd ed. Cary, NC: Institut SAS

  • Teks terapan yang bagus untuk pengguna SAS

Bagdonavicius V, Nikulin M (2002). Model Kehidupan yang Dipercepat: Pemodelan dan Analisis Statistik. Boca Raton, FL: Chapman & Hall/CRC Press.

  • Sumber daya yang bagus untuk informasi lebih lanjut tentang model waktu kegagalan yang dipercepat parametrik dan semi-parametrik dan bagaimana mereka dibandingkan dengan model bahaya proporsional

Artikel Metodologis

Artikel Pendahuluan/Ikhtisar

Hougaard P (1999). Dasar-dasar Data Kelangsungan Hidup. Biometrik 55(1): 13-22. PMID: 11318147 .

Clark TG, Bradburn MJ, Cinta SB, Altman DG (2003). Analisis kelangsungan hidup bagian I: konsep dasar dan analisis pertama. Br J Kanker 89(2): 232-8. PMID: 12865907

Clark TG, Bradburn MJ, Cinta SB, Altman DG (2003). Analisis kelangsungan hidup bagian II: analisis data multivariat-pengantar konsep dan metode. Br J Kanker 89(3): 431-6. PMID: 1288808

Clark TG, Bradburn MJ, Cinta SB, Altman DG (2003). Analisis kelangsungan hidup bagian II: analisis data multivariat-memilih model dan menilai kecukupan dan kecocokannya. Br J Kanker 89(4): 605-11. PMID: 12951864

Clark TG, Bradburn MJ, Cinta SB, Altman DG (2003). Analisis kelangsungan hidup bagian IV: konsep dan metode lebih lanjut dalam analisis kelangsungan hidup. Br J Kanker 89(5): 781-6. PMID: 12942105

  • Rangkaian empat artikel di atas adalah gambaran pendahuluan yang sangat baik tentang metode dalam analisis kelangsungan hidup yang ditulis dengan sangat baik dan mudah dipahami – sangat dianjurkan.

Usia sebagai skala waktu

Korn EL, Graubard BI, Midthune D (1997). Analisis waktu-ke-peristiwa dari tindak lanjut survei longitudinal: pilihan skala waktu. Am J Epidemiol 145(1):72-80. PMID: 8982025

  • Makalah menganjurkan penggunaan usia sebagai skala waktu daripada waktu belajar.

Ingram DD, Makuc DM, Feldman JJ (1997). Re: Analisis waktu-ke-peristiwa dari tindak lanjut survei longitudinal: pilihan skala waktu. Am J Epidemiol 146(6)::528-9. PMID: 9290515 .

  • Komentar di koran Korn yang menjelaskan tindakan pencegahan yang harus diambil saat menggunakan usia sebagai skala waktu.

Thiebaut AC, Benichou J (2004). Pilihan skala waktu dalam analisis model Cox dari data kohort epidemiologi: studi simulasi. Stat Med 30;23(24):3803-20. PMID: 15580597

  • Studi simulasi menunjukkan besarnya bias untuk derajat yang berbeda dari hubungan antara usia dan kovariat yang menarik ketika menggunakan waktu pada studi sebagai skala waktu.

Canchola AJ, Stewart SL, Bernstein L, dkk. Regresi Cox menggunakan skala waktu yang berbeda. Tersedia di: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • Makalah yang bagus membandingkan 5 model regresi Cox dengan variasi waktu belajar atau usia sebagai skala waktu dengan kode SAS.

Menyensor

Huang CY, Ning J, Qin J (2015). Inferensi kemungkinan semiparametrik untuk data terpotong kiri dan disensor kanan. Biostatistik [epub] PMID: 25796430 .

  • Makalah ini memiliki pengantar yang bagus untuk analisis data yang disensor dan memberikan prosedur estimasi baru untuk distribusi waktu kelangsungan hidup dengan data terpotong kiri dan tersensor kanan. Ini sangat padat dan memiliki fokus statistik tingkat lanjut.

Kain KC, Harlow SD, Little RJ, Nan B, Yosef M, Taffe JR, Elliott MR (2011). Bias karena pemotongan kiri dan sensor kiri dalam studi longitudinal proses perkembangan dan penyakit. Am J Epidemiol 173(9):1078-84. PMID: 21422059 .

  • Sumber daya yang sangat baik yang menjelaskan bias yang melekat pada data yang disensor kiri dari perspektif epidemiologi.

Sun J, Sun L, Zhu C (2007). Menguji model peluang proporsional untuk data yang disensor interval. Data Anal Seumur Hidup 13:37–50. PMID 17160547 .

distrik sekolah minersville v. gobitis
  • Artikel padat statistik lainnya tentang aspek analisis data TTE yang bernuansa, tetapi memberikan penjelasan yang baik tentang data yang disensor interval.

Robins JM (1995a) Sebuah metode analitik untuk percobaan acak dengan sensor informatif: Bagian I. Data Anal Seumur Hidup 1: 241-254. PMID 9385104 .

Robins JM (1995b) Sebuah metode analitik untuk percobaan acak dengan sensor informatif: Bagian II. Anal Data Seumur Hidup 1: 417–434. PMID 9385113 .

  • Dua makalah yang membahas metode untuk menangani sensor informatif.

Metode kelangsungan hidup non-parametrik

Borgan (2005) Kaplan-Meier Estimator. Ensiklopedia Biostatistik DOI: 10.1002 / 0470011815.b2a11042

  • Ikhtisar yang sangat baik dari estimator Kaplan-Meier dan hubungannya dengan estimator Nelson-Aalen

Rodríguez G (2005). Estimasi Non-Parametrik dalam Model Kelangsungan Hidup. Tersedia dari: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Pengenalan metode non-parametrik dan model hazard proporsional Cox yang menjelaskan hubungan antara metode dengan rumus matematika mathematical

Cole SR, Hernan MA (2004). Kurva kelangsungan hidup yang disesuaikan dengan bobot probabilitas terbalik. Metode Komputasi Program Biomed 75(1): 35-9. PMID: 15158046

  • Menjelaskan penggunaan IPW untuk membuat kurva Kaplan-Meier yang disesuaikan. Termasuk contoh dan makro SAS.

Zhang M (2015). Metode yang kuat untuk meningkatkan efisiensi dan mengurangi bias dalam memperkirakan kurva kelangsungan hidup dalam uji klinis acak. Data Seumur Hidup Anal 21(1): 119-37. PMID: 24522498

  • Metode yang diusulkan untuk kurva kelangsungan hidup yang disesuaikan dengan kovariat di RCT

Metode kelangsungan hidup semi-parametrik

Cox DR (1972) Model regresi dan tabel kehidupan (dengan diskusi). J R Statistik Soc B 34: 187–220.

  • Referensi klasik.

Christensen E (1987) Analisis kelangsungan hidup multivariat menggunakan model regresi Cox. Hepatologi 7: 1346–1358. PMID 3679094 .

  • Menjelaskan penggunaan model Cox menggunakan contoh yang memotivasi. Tinjauan yang sangat baik dari aspek-aspek kunci dari analisis model Cox, termasuk bagaimana menyesuaikan model Cox dan memeriksa asumsi model.

Grambsch PM, Therneau TM (1994) Tes dan diagnostik bahaya proporsional berdasarkan residu tertimbang. Biometrika 81: 515–526.

  • Makalah mendalam tentang pengujian asumsi bahaya proporsional. Perpaduan yang baik antara teori dan penjelasan statistik tingkat lanjut.

Ng'andu NH (1997) Perbandingan empiris uji statistik untuk menilai asumsi proporsional hazard dari model Cox. Stat Med 16: 611–626. PMID 9131751 .

  • Makalah mendalam lainnya tentang pengujian asumsi bahaya proporsional, yang satu ini mencakup diskusi tentang memeriksa residu dan efek sensor.

Metode kelangsungan hidup parametrik

Rodrίguez, G (2010). Model Kelangsungan Hidup Parametrik. Tersedia dari: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • pengantar singkat untuk distribusi yang paling umum digunakan dalam analisis kelangsungan hidup parametrik

Nardi A, Schemper M (2003). Membandingkan Cox dan model parametrik dalam studi klinis.Stat Med 22 (23): 2597-610. PMID: 14652863

  • Memberikan contoh yang baik membandingkan model semi-parametrik dengan model yang menggunakan distribusi parametrik umum dan berfokus pada penilaian model fit

Royston P, Parmar MK (2002). Model proporsional-bahaya dan proporsional parametrik yang fleksibel untuk data kelangsungan hidup yang disensor, dengan aplikasi untuk pemodelan prognostik dan estimasi efek pengobatan. Stat Med 21(15): 2175-97. PMID: 12210632

  • Penjelasan yang baik untuk dasar-dasar model hazard dan odds proporsional dan perbandingan dengan spline kubik

Cox C, Chu H, Schneider MF, Muñoz A (2007). Analisis kelangsungan hidup parametrik dan taksonomi fungsi bahaya untuk distribusi gamma umum. Statistik Med 26:4352–4374. PMID 17342754 .

  • Memberikan gambaran yang sangat baik tentang metode kelangsungan hidup parametrik, termasuk taksonomi fungsi bahaya dan diskusi mendalam tentang keluarga distribusi gamma umum.

Crowther MJ, Lambert PC (2014). Kerangka kerja umum untuk analisis kelangsungan hidup parametrik.Stat Med 33(30): 5280-97. PMID: 25220693

  • Menjelaskan asumsi terbatas dari distribusi parametrik yang umum digunakan dan menjelaskan metodologi spline kubik terbatas cubic

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). Model kelangsungan hidup parametrik untuk data yang disensor interval dengan kovariat bergantung waktu. Biometrik 7 (4): 599-614. PMID: 16597670

  • Ekstensi dan contoh cara menggunakan model parametrik dengan data yang disensor interval

Kovariat Bervariasi Waktu

Fisher LD, Lin DY (1999). Kovariat tergantung waktu dalam model regresi proporsional-bahaya Cox. Annu Rev Kesehatan Masyarakat 20: 145-57. PMID: 10352854

  • Penjelasan menyeluruh dan mudah dipahami tentang kovariat yang bervariasi waktu dalam model Cox, dengan lampiran matematika

Petersen T (1986). Menyesuaikan model kelangsungan hidup parametrik dengan kovariat bergantung waktu. Statistik Aplikasi 35(3): 281-88.

  • Artikel padat, tetapi dengan contoh terapan yang bermanfaat

Analisis risiko bersaing

Lihat Risiko Bersaing

Tai B, Machin D, White I, Gebski V (2001) Bersaing analisis risiko pasien dengan osteosarcoma: perbandingan empat pendekatan yang berbeda. Stat Med 20: 661–684. PMID 11241570 .

  • Makalah mendalam yang bagus yang menjelaskan empat metode berbeda dalam menganalisis data risiko yang bersaing, dan menggunakan data dari uji coba acak pasien dengan osteosarkoma untuk membandingkan keempat pendekatan ini.

    lemon v. kurtzman (1971)

Checkley W, Brower RG, Muñoz A (2010). Inferensi untuk peristiwa bersaing yang saling eksklusif melalui campuran distribusi gamma umum. Epidemiologi 21(4): 557–565. PMID 20502337 .

  • Makalah tentang risiko bersaing menggunakan distribusi gamma umum.

Analisis data berkerumun dan model kelemahan

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Model bahaya proporsional dengan efek acak untuk menguji efek pusat dalam uji klinis kanker multisenter. Metode Stat Med Res 11: 221–236. PMID 12094756 .

  • Makalah dengan penjelasan teoretis dan matematis yang sangat baik tentang mempertimbangkan pengelompokan ketika menganalisis data kelangsungan hidup dari uji klinis multi-pusat.

O'Quigley J, Stare J (2002) Model bahaya proporsional dengan kelemahan dan efek acak. Stat Med 21: 3219–3233. PMID 12375300 .

  • Perbandingan head-to-head model kelemahan dan model efek acak.

Balakrishnan N, Peng Y (2006). Model kelemahan gamma umum. Statistik Med 25: 2797–2816. PMID

  • Makalah tentang model kelemahan menggunakan distribusi gamma umum sebagai distribusi kelemahan.

Rondeau V, Mazroui Y, Gonzalez JR (2012). frailtypack: Paket R untuk Analisis Data Kelangsungan Hidup Berkorelasi dengan Model Frailty Menggunakan Penalized Likelihood Estimation atau Parametrical Estimation. Jurnal Perangkat Lunak Statistik 47(4): 1-28.

  • Sketsa paket R dengan informasi latar belakang yang baik tentang model kelemahan.

Schaubel DE, Cai J (2005). Analisis data kejadian berulang berkerumun dengan aplikasi untuk tingkat rawat inap di antara pasien gagal ginjal. Biostatistik 6(3):404-19. PMID 15831581 .

  • Makalah luar biasa di mana penulis menyajikan dua metode untuk menganalisis data kejadian berulang yang berkerumun, dan kemudian mereka membandingkan hasil dari model yang diusulkan dengan yang didasarkan pada model kelemahan.

Gharibvand L, Liu L (2009). Analisis Data Survival dengan Clustered Events. SAS Global Forum 2009 Makalah 237-2009.

  • Ringkas dan mudah dipahami sumber untuk analisis data waktu ke peristiwa dengan peristiwa berkerumun dengan prosedur SAS.

Analisis Peristiwa Berulang

Twisk JW, Smidt N, de Vente W (2005). Analisis terapan peristiwa berulang: gambaran praktis. J Epidemiol Kesehatan Masyarakat 59(8): 706-10. PMID: 16020650

  • Pengenalan yang sangat mudah untuk memahami pemodelan peristiwa berulang dan konsep set risiko

Villegas R, Juliá O, Ocaña J (2013). Studi empiris waktu kelangsungan hidup berkorelasi untuk kejadian berulang dengan margin bahaya proporsional dan efek korelasi dan sensor. Metode Med Res BMC 13:95. PMID: 23883000

  • Menggunakan simulasi untuk menguji kekokohan model yang berbeda untuk data peristiwa berulang

Kelly PJ, Lim LL (2000). Analisis kelangsungan hidup untuk data peristiwa berulang: aplikasi untuk penyakit menular masa kanak-kanak. Stat Med 19 (1): 13-33. PMID: 10623190

  • Contoh terapan dari empat pendekatan utama untuk memodelkan data kejadian berulang

Wei LJ, Lin DY, Weissfeld L (1989). Analisis regresi multivariat data waktu kegagalan tidak lengkap dengan pemodelan distribusi marjinal. Jurnal Asosiasi Statistik Amerika84 (108): 1065-1073

Artikel asli yang menjelaskan model marginal untuk analisis peristiwa berulang event

Kursus

Institut Musim Panas Epidemiologi dan Kesehatan Penduduk di Universitas Columbia (EPIC)

Statistical Horizons, penyedia swasta seminar statistik khusus yang diajarkan oleh para ahli di bidangnya

Inter-university Consortium for Political and Social Research (ICPSR) Summer Program in Quantitative Methods of Social Research, bagian dari Institute for Social Research di University of Michigan

  • Seminar 3 hari tentang analisis kelangsungan hidup, pemodelan sejarah peristiwa, dan analisis durasi ditawarkan pada 22-24 Juni 2015 di Berkeley, CA, yang diajarkan oleh Tenko Raykov dari Michigan State University. Tinjauan komprehensif tentang metode bertahan hidup lintas disiplin ilmu (tidak hanya kesehatan masyarakat): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

Institute for Statistics Research menawarkan dua kursus online untuk analisis kelangsungan hidup, yang ditawarkan beberapa kali dalam setahun. Kursus-kursus ini didasarkan dari buku teks analisis Terapan oleh Klein dan Kleinbaum (lihat di bawah) dan dapat diambil a la carte atau sebagai bagian dari program sertifikat dalam Statistik:

  • Pengantar analisis kelangsungan hidup, dengan fokus pada model Cox semi-parametrik, yang diajarkan oleh David Kleinbaum atau Matt Strickland: http://www.statistics.com/survival/

  • Analisis kelangsungan hidup tingkat lanjut, termasuk model parametrik, analisis perulangan, dan model kelemahan, yang diajarkan oleh Matt Strickland: http://www.statistics.com/survival2/

Institute for Digital Research and Education di UCLA menawarkan apa yang mereka sebut seminar melalui situs web mereka untuk analisis kelangsungan hidup dalam perangkat lunak statistik yang berbeda. Seminar-seminar ini menunjukkan bagaimana melakukan analisis kelangsungan hidup terapan, lebih fokus pada kode daripada teori.

Artikel Menarik

Pilihan Editor

Pesta Black Panther Singkatan dari Kesehatan
Pesta Black Panther Singkatan dari Kesehatan
Dalam pertunjukan paruh waktu Super Bowl baru-baru ini, Beyoncé, diapit oleh penari dengan kulit hitam dan baret, memberikan penghormatan kepada Black Panther Party, meningkatkan kemarahan kaum konservatif yang mengasosiasikan Panthers dengan tindakan menghasut dan sentimen anti-polisi.Didirikan 50 tahun lalu di Oakland, California, Black Panther dikenang karena retorika revolusioner mereka. Direktur FBI J
Bakri v. Israel Film Council
Bakri v. Israel Film Council
Columbia Global Freedom of Expression berusaha untuk memajukan pemahaman tentang norma-norma dan institusi internasional dan nasional yang paling baik melindungi arus bebas informasi dan ekspresi dalam komunitas global yang saling terhubung dengan tantangan-tantangan besar yang harus diatasi bersama. Untuk mencapai misinya, Global Freedom of Expression melakukan dan menugaskan proyek penelitian dan kebijakan, menyelenggarakan acara dan konferensi, dan berpartisipasi dalam dan berkontribusi pada debat global tentang perlindungan kebebasan berekspresi dan informasi di abad ke-21.
Brett Dignam
Brett Dignam
Seorang guru pemenang penghargaan, Brett Dignam telah menjadi direktur yang tak kenal lelah dari Klinik Hukum Menantang Konsekuensi dari Penjara Massal sejak bergabung dengan fakultas di 2010. Dia membawa ke kelas pengalamannya sebagai advokat dan litigator sengit di lebih dari 30 federal dan kasus negara di bidang hak-hak tahanan. Dengan murid-muridnya, dia telah menantang kondisi kurungan mulai dari perawatan medis yang tidak memadai hingga kurungan isolasi seumur hidup. Siswa di Klinik Penahanan Massal telah memiliki beberapa kemenangan penting. Baru-baru ini, lima siswa berhasil berargumen di Pengadilan Distrik AS bahwa kurungan isolasi permanen melanggar berbagai ketentuan Konstitusi AS. Sebelum memasuki dunia akademis, Dignam menjabat sebagai petugas hukum untuk Hakim William H. Orrick di Pengadilan Distrik AS di San Francisco, dan dia kemudian mengembangkan praktik litigasi penjara di pengadilan federal dan negara bagian. Dia kemudian bergabung dengan Departemen Kehakiman AS di Washington, D.C., di mana dia bekerja sebagai pengacara kebijakan penegakan pajak dan banding pidana di semua pengadilan banding federal. Dia membantu mengembangkan kebijakan divisi pajak Departemen Kehakiman tentang berbagai masalah mulai dari pencucian uang hingga Racketeer Influenced and Corrupt Organizations Act (RICO). Sebagai profesor di Yale Law School dari tahun 1992 hingga 2010, Dignam memimpin Layanan Hukum Penjara, Litigasi Federal Kompleks, dan Klinik Advokasi Mahkamah Agung. Dia telah mengajar dan mengawasi siswa yang mengerjakan isu-isu yang berkaitan dengan kemiskinan dan HIV, konflik pemilik/penyewa, dan imigrasi. Dia juga telah membimbing siswa melalui dengar pendapat administratif dan pengadilan negara bagian dan federal dan pengadilan banding atas kasus-kasus yang melibatkan klaim habeas negara bagian dan pelanggaran Undang-Undang Hak Suara. Sebagai wakil dekan pertama Columbia Law School untuk pembelajaran pengalaman dari 2018 hingga 2021, Dignam mengawasi lusinan magang, simulasi, dan praktikum serta tujuh klinik.
Carlos Sandoval
Carlos Sandoval
Alex Raskolnikov
Alex Raskolnikov
Seorang ahli pajak yang dihormati, Alex Raskolnikov juga adalah ketua bersama fakultas Pusat Studi Transaksional Charles Evans Gerber di Columbia Law School. Penelitiannya meliputi perpajakan pendapatan federal, perpajakan instrumen keuangan, kebijakan pajak, administrasi pajak, analisis ekonomi pencegahan, risiko, dan ketidakpastian. Raskolnikov telah bersaksi di depan Kongres tentang perlakuan pajak atas produk keuangan dan telah memberi kuliah tentang ini dan mata pelajaran terkait di Austria, Brasil, Kanada, Prancis, Israel, Italia, Jepang, Belanda, Spanyol, dan Inggris. Sebelum bergabung dengan fakultas pada tahun 2004, Raskolnikov adalah associate di Davis Polk & Wardwell, di mana ia mengkhususkan diri dalam perpajakan instrumen keuangan dan lembaga keuangan. Dia telah menerima Penghargaan Willis L.M. Reese dari Sekolah Hukum untuk Keunggulan dalam Pengajaran, sebuah penghargaan tahunan yang dipilih oleh J.D. dan LL.M. kelas. Raskolnikov adalah anggota terafiliasi dari Pusat Studi Hukum & Ekonomi Columbia, dan dia melayani di dewan Pusat Bisnis, Hukum, dan Kebijakan Publik Richard Paul Richman, Yayasan Tannenwald, dan Jurnal Hukum Pajak Columbia. Dia juga anggota Asosiasi Hukum dan Ekonomi Amerika, Asosiasi Pajak Nasional, dan Klub Pajak.
Program Audit
Program Audit
Perkaya pendidikan Anda dengan menghadiri kuliah pilihan di Seni & Sains selama tahun akademik.
Panduan Columbia untuk Kasus Pentagon Papers
Panduan Columbia untuk Kasus Pentagon Papers
Max Frankel '52CC, '53GSAS ingat pertama kali dia melihat Pentagon Papers. Saat itu Maret 1971, dan Frankel adalah kepala biro Washington di New York Times. Seorang reporter, Neil Sheehan, telah membawakannya beberapa halaman laporan rahasia pemerintah yang ditawarkan oleh sumber anonim kepadanya. Materinya tentang perang di Vietnam, dan halaman-halamannya, menurut Frankel, dicap sangat rahasia—sensitif.