頑固なバイアスは繰り返しで除去する

頑固なバイアスは繰り返しで除去する

タイトル: Null It Out: Guarding Protected Attributes by Iterative Nullspace Projection
著者: Shauli Ravfogel, Yanai Elazar, Hila Gonen, Michael Twiton, Yoav Goldberg
会議・出版: ACL
年: 2020

💡 概要

  • 零空間へ射影を繰り返すことで,分散表現に学習された情報を除去する手法 (Iterative Null-space Projection; INLP) を提案
  • 除去したい情報を検出する線形モデルを学習し表現を零空間に射影することを繰り返すことで線形モデルが情報を検出できない,つまり情報を除去することができる
  • 公平性に関するデータセットに適応し,バイアス除去することで提案手法の有効性を示した
続きを読む
言語モデルの感情バイアスの評価と除去

言語モデルの感情バイアスの評価と除去

タイトル: Reducing Sentiment Bias in Language Models via Counterfactual Evaluation
著者: Po-Sen Huang, Huan Zhang, Ray Jiang, Robert Stanforth, Johannes Welbl, Jack Rae, Vishal Maini, Dani Yogatama, Pushmeet Kohli
会議・出版: EMNLP Findings
年: 2020

💡 概要

  • 言語モデルによって生成されたテキストの感情バイアスを評価し除去する
  • 国名,職業や性別に関する文脈が与えたれた際に言語モデルが生成したテキストの感情分析を行いその偏りにより評価を行う
  • 言語モデルの隠れ層に対して正則化を行うことで感情バイアスの除去を行う
続きを読む
マスク付き言語モデルのマスクトークンを用いない差別的バイアスの評価

マスク付き言語モデルのマスクトークンを用いない差別的バイアスの評価

タイトル:Unmasking the Mask – Evaluating Social Biases in Masked Language Models
著者:Masahiro Kaneko, Danushka Bollegala
会議・出版:arXiv
年:2021

💡 概要

  • BERTやALBERTのようなマスク付き言語モデルの公平性に関するバイアス評価についての研究
  • マスクトークンを用いないバイアス評価手法 (AULとAULA)を提案
  • バイアス評価にマスクトークンを用いることの問題点を分析
続きを読む