頑固なバイアスは繰り返しで除去する

頑固なバイアスは繰り返しで除去する

タイトル: Null It Out: Guarding Protected Attributes by Iterative Nullspace Projection
著者: Shauli Ravfogel, Yanai Elazar, Hila Gonen, Michael Twiton, Yoav Goldberg
会議・出版: ACL
年: 2020

💡 概要

  • 零空間へ射影を繰り返すことで,分散表現に学習された情報を除去する手法 (Iterative Null-space Projection; INLP) を提案
  • 除去したい情報を検出する線形モデルを学習し表現を零空間に射影することを繰り返すことで線形モデルが情報を検出できない,つまり情報を除去することができる
  • 公平性に関するデータセットに適応し,バイアス除去することで提案手法の有効性を示した
続きを読む
辞書を用いた単語分散表現の様々な差別的バイアス除去

辞書を用いた単語分散表現の様々な差別的バイアス除去

タイトル: Dictionary-based Debiasing of Pre-trained Word Embeddings
著者: Masahiro Kaneko, Danushka Bollegala
会議・出版: EACL
年: 2021

💡 概要

  • Word2vecやGloVeなどの単語分散表現に含まれる差別的バイアスを除去する研究
  • 辞書の定義文を用いることでバイアスに関する単語リストを使わずにバイアス除去する手法を提案
  • 性別,人種や年齢など幅広いバイアスに対して有効であることを実証
続きを読む