Berbagi teknologi

Laporan Mingguan Machine Learning FMP untuk Minggu ke-46

2024-07-08

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

minggu ke 46 FMP

Ringkasan

Minggu ini saya membaca makalah berjudul Mengejar Kewajaran dalam Grafik: Perspektif Arsitektur GNN. Makalah ini mengusulkan skema penyampaian pesan yang adil (FMP) yang dipandu oleh kerangka optimasi terpadu jaringan saraf grafik (GNN), yang bertujuan untuk meningkatkan keadilan pemrosesan data grafik. Pendekatan ini dicapai melalui dua langkah inti: pertama menggabungkan data grafik, dan kemudian secara eksplisit mengupayakan representasi pusat setiap populasi statistik untuk mengurangi bias. Metode ini membangun masalah optimasi yang mempertimbangkan keadilan dan kelancaran data, dan menggunakan teknik konjugasi Fenchel dan penurunan gradien yang dikombinasikan dengan karakteristik fungsi softmax untuk menyelesaikannya secara efisien, menghasilkan representasi node yang adil dan informatif. Skema ini langsung ditanamkan ke dalam GNN untuk meningkatkan keadilan dan keakuratan tugas klasifikasi node tanpa pemrosesan awal data. Hasil eksperimen menunjukkan bahwa FMP berkinerja lebih baik dibandingkan beberapa model dasar pada kumpulan data nyata, dan sepenuhnya memverifikasi efektivitasnya dari perspektif arsitektur model, efisiensi, dan pemanfaatan atribut sensitif.

Abstrak

Koran mingguan minggu ini menguraikan makalah berjudul Chasing Fairness in Graphs: A GNN Architecture Perspective. Makalah ini memperkenalkan skema Fair Message Passing (FMP) yang dipandu oleh kerangka kerja pengoptimalan terpadu Graph Neural Networks (GNN), yang bertujuan untuk meningkatkan keadilan dalam pemrosesan data grafik. FMP mencapainya melalui dua langkah inti: pertama, menggabungkan data grafik, dan kemudian secara eksplisit berusaha untuk merepresentasikan pusat berbagai kelompok statistik untuk mengurangi bias. Pendekatan ini merumuskan masalah pengoptimalan yang mempertimbangkan keadilan dan kelancaran data, dan memanfaatkan dualitas Fenchel dan teknik penurunan gradien, yang dikombinasikan dengan sifat-sifat fungsi softmax, untuk memecahkan masalah secara efisien dan menghasilkan representasi simpul yang adil dan informatif. Skema ini secara langsung tertanam ke dalam GNN untuk meningkatkan keadilan dan keakuratan tugas klasifikasi simpul, tanpa perlu praproses data. Hasil eksperimen pada kumpulan data dunia nyata menunjukkan bahwa FMP mengungguli beberapa model dasar, secara komprehensif memvalidasi efektivitasnya dari perspektif arsitektur model, efisiensi, dan pemanfaatan atribut sensitif.

1. Pertanyaan

Topik: Mengejar Keadilan dalam Grafik: Perspektif Arsitektur GNN

Penulis: Zhimeng Jiang1, Xiaotian Han1, Chao Fan2, Zirui Liu3, Na Zou4, Ali Mostafavi1, Xia Hu3

melepaskan:Jil. 38 Nomor 19: AAAI-24

Tautan: https://doi.org/10.1609/aaai.v38i19.30115

2. Abstrak

Artikel ini bertujuan untuk mencapai keadilan yang lebih baik melalui kerangka kerja GNN yang baru, sehingga artikel ini mengusulkan untuk merancang dalam kerangka optimasi terpadu GNNPesan Adil (FMP) .Perlu dicatat bahwa FMP menggunakankehilangan entropi silangSecara eksplisit menyajikan penggunaan atribut sensitif dalam forward pass untuk tugas klasifikasi node, sementaraTidak diperlukan pemrosesan awal data .Di FMP, gunakan pertama kalipolimerisasiuntuk mengeksploitasi informasi tetangga, dan kemudianMitigasi Bias Langkah-langkah tersebut secara eksplisit menyatukan pusat representasi simpul grup statistik data. Dengan cara ini, skema FMP dapat mengumpulkan informasi yang berguna dari negara-negara tetangga dan memitigasi bias untuk mencapai keadilan yang lebih baik dan kinerja prediksi trade-off.Klasifikasi simpulEksperimen pada tugas tersebut menunjukkan bahwa FMP yang diusulkan mengungguli beberapa baseline dalam hal keadilan dan akurasi pada tiga kumpulan data dunia nyata.

3. FMP

FMP dapat mencapai prediksi yang adil dari perspektif tulang punggung model. Secara khusus, pesan yang adil dirumuskan sebagai masalah optimasi untuk mencapai kelancaran dan representasi node yang adil secara bersamaan. Dikombinasikan dengan algoritme pengoptimalan yang efektif dan efisien, pesan adil berbentuk tertutup dihasilkan. Terakhir, FMP yang diusulkan diintegrasikan ke dalam GNN yang adil dalam tiga tahap, termasuk tahap transformasi, agregasi, dan debiasing, seperti yang ditunjukkan pada Gambar 1. Ketiga tahap ini masing-masing menggunakan fitur node, topologi grafik, dan atribut sensitif.

gambar-20240707151714855

3.1 Kerangka optimasi

Bahasa Indonesia: min ⁡ F λ s 2 tr ( FTT ~ F ) 1 2 ∣ ∣ F − X trans ∣ ∣ F 2 λ f ∣ ∣ Δ s SF ( F ) ∣ ∣ 1 (1) min_{mathbf F}frac{lambda_s}{2}tr(mathbf F^T tilde {mathbf T}mathbf F) frac12||mathbf F-mathbf X_{trans}||^2_F lambda_f||Delta_sSF(mathbf F)||_1 tag{1}Fmenit2λSTR(FTT~F) 21∣∣FXTRsebuahSF2 λF∣∣ΔSBahasa Inggris(F)1(1)

$tilde L mewakili matriks Laplacian yang dinormalisasi, mewakili matriks Laplacian yang dinormalisasi,mewakili matriks Laplacian yang dinormalisasi,h_s(·)$ dan h_f(·)HF() Melambangkan kelancaran dan keadilan tujuan, X trans ∈ R n × dout X_{trans} dalam R^{n×d_{out}}XTRsebuahSRN×DHaikamkamkamuT adalah yang diubah ragu d_{keluar}DHaikamkamkamuTKarakteristik simpul dimensi. F ∈ R n × dout F dalam R^{n×d_{out}}FRN×DHaikamkamkamuTadalah fitur simpul gabungan dengan ukuran matriks yang sama.

Dua istilah pertama menjaga kesamaan representasi node yang terhubung, sehingga meningkatkan kelancaran grafik. Istilah terakhir menerapkan representasi simpul yang adil sehingga rata-rata prediksi probabilitas dapat tetap konstan di antara kelompok atribut sensitif yang berbeda.

Koefisien regularisasi λs dan λf secara adaptif mengontrol trade-off antara kelancaran dan kewajaran grafik.
Bahasa Indonesia: hs(F) = min ⁡ F λ s 2 tr(FTT~F) 1 2 ∣ ∣ F − X trans ∣ ∣ F 2 h_s(mathbf F)=min_{mathbf F}frac{lambda_s}{2}tr(mathbf F^T tilde {mathbf T}mathbf F) frac12||mathbf F-mathbf X_{trans}||^2_FHS(F)=Fmenit2λSTR(FTT~F) 21∣∣FXTRsebuahSF2
Target kelancaran hs(·): Matriks ketetanggaan dalam skema pesan grafik yang ada dinormalisasi untuk meningkatkan stabilitas numerik dan mencapai kinerja yang unggul.Dari perspektif yang berpusat pada tepi, tujuan pemulusan memaksa representasi simpul yang terhubung menjadi serupa karena
Bahasa Indonesia: tr(FTT~F) = ∑(vi,vj) ∈ E∣∣Fidi1−Fidj1∣∣F2(2) tr(mathbf F^T tilde {mathbf T}mathbf F)=jumlah_{(v_i,v_j)dalam {Epsilon}}||frac{mathbf F_i}{akar{d_i1}}-frac{mathbf F_i}{akar{d_j1}}||^2_Ftag{2}TR(FTT~F)=(kitaSaya,kitaJ)Bahasa Inggris∣∣DSaya 1 FSayaDJ 1 FSayaF2(2)
Sasaran kewajaran hf(·): Sasaran kewajaran mengukur deviasi representasi node setelah agregasi. Vektor kejadian atribut sensitif Δs mewakili grup atribut sensitif dan ukuran grup dengan penjumlahan tanda dan nilai absolut.Vektor peristiwa atribut sensitif adalah
Nilai Δs = 1