2022-04-18に投稿2022-04-18に更新🔎 研究‍3分で読む (約406語)

自然言語処理における英語論文誌の投稿先を探す

💡 概要

自然言語処理の英語論文誌の投稿先を探すのに参考になったサイト

続きを読む

論文メモ：下流タスクと言語モデル自体の公平性の評価、汎化性のための偽の相関のバイアス除去、正解ラベルなしのプロンプトエンジニアリング

2022-03-31に投稿2022-03-31に更新🔎 研究‍10分で読む (約1572語)

論文メモ：下流タスクと言語モデル自体の公平性の評価、汎化性のための偽の相関のバイアス除去、正解ラベルなしのプロンプトエンジニアリング

💡 概要

下流タスクと言語モデル自体の公平性の評価にはほとんど相関がない
汎化性能を高めるために偽の相関によるバイアスを除去する
相互情報量による正解ラベルを用いないプロンプトエンジニアリング

続きを読む

論文メモ：人間とAIの協調性の改善、トークン化、変化要因を制御した言語間の転移分析、デルタチューニングを体系的な調査・定義

2022-03-27に投稿2022-03-31に更新🔎 研究‍16分で読む (約2383語)

論文メモ：人間とAIの協調性の改善、トークン化、変化要因を制御した言語間の転移分析、デルタチューニングを体系的な調査・定義

💡 概要

人間の行動をモデル化し最適化することで人間とAIの協調性を改善
トークン化、形態素や構文などの要因を制御した言語間の転移分析
デルタチューニングを体系的に定義し100以上のNLPタスクで調査

続きを読む

用例を基にした文法誤り訂正モデルを用いた言語学習者のための解釈性

2022-02-24に投稿2022-02-24に更新🔎 研究‍20分で読む (約3012語)

用例を基にした文法誤り訂正モデルを用いた言語学習者のための解釈性

タイトル：Interpretability for Language Learners Using Example-Based Grammatical Error Correction
著者：Masahiro Kaneko, Sho Takase, Ayana Niwa, Naoaki Okazaki
会議・出版： ACL
年： 2022

💡 概要

言語学習のための文法誤り訂正モデルは訂正性能だけでなく結果の解釈性についても重要であるが、これまでほとんど議論されてこなかった。
近年、予測に用例を用いることで予測の根拠を提示できるようにし、モデルの解釈性を改善する手法が提案されている。言語学習では用例検索システムなどを用いて学習者が文法や語彙を学習することができる。そのため、予測に関連する用例を用いて文法誤り訂正モデルの解釈性を改善することで、同時に学習に有益な用例を提供できると考えられる。
そこで、本論文では言語学習者の解釈性のために用例を基にして予測を行う文法誤り訂正モデルを提案する。文法誤り訂正の訂正結果と類似する用例を検索し提示することは言語学習者に有益であることを示した。さらに、用例を用いることで文法誤り訂正モデルの性能も改善できることも明らかにした。

続きを読む

論文メモ：訓練不要な層に置換することによる高速化、翻訳モデルの出力による評価モデルの弱点分析、学習設定のデータスケーリング法則への影響、多言語言語モデルXGLM

2022-02-18に投稿2022-02-24に更新🔎 研究‍14分で読む (約2123語)

論文メモ：訓練不要な層に置換することによる高速化、翻訳モデルの出力による評価モデルの弱点分析、学習設定のデータスケーリング法則への影響、多言語言語モデルXGLM

💡 概要

訓練可能な層を訓練不要な層に置換することによる高速化
評価モデルに対して翻訳モデルを最適化することで評価モデルの弱点を分析
学習設定がデータスケーリングの法則に与える影響
大規模多言語言語モデルXGLMのfew-shot学習とzero-shot学習の調査

続きを読む

論文メモ：多言語音声言語モデルmSLAM、ニューラルネットワークの忘却は必要、事前学習モデルを効率化するpNLP-Mixer

2022-02-11に投稿2022-02-11に更新🔎 研究‍11分で読む (約1613語)

論文メモ：多言語音声言語モデルmSLAM、ニューラルネットワークの忘却は必要、事前学習モデルを効率化するpNLP-Mixer

💡 概要

51言語の音声データと101言語のテキストデータで学習された多言語音声言語モデルmSLAM
ニューラルネットワークの忘却、実は性能改善に寄与している
射影ベースのMLP-Mixerにより事前学習モデルを効率化するpNLP-Mixer

続きを読む

論文メモ：CNNとTransformer事前学習モデルの比較、ルールベースと深層学習を統合した手法DEEPCTRL、アテンション機構の説明性に対する忠実性の調査

2022-02-04に投稿2022-02-04に更新🔎 研究‍10分で読む (約1551語)

論文メモ：CNNとTransformer事前学習モデルの比較、ルールベースと深層学習を統合した手法DEEPCTRL、アテンション機構の説明性に対する忠実性の調査

💡 概要

CNN事前学習モデルはTransformer事前学習モデルに匹敵する
深層学習モデルにルールベースを制御し考慮する手法DEEPCTRL
説明性におけるアテンション機構の重みとモデル予測の忠実性の間の整合性調査

続きを読む

論文メモ：知識蒸留と枝刈りによる公平性改善、モデル出力の一貫性を評価するDiscoScore、寄与率による説明性に対する人間の理解、特徴量による説明性は人間理解への貢献を検証

2022-02-02に投稿2022-02-04に更新🔎 研究‍15分で読む (約2305語)

論文メモ：知識蒸留と枝刈りによる公平性改善、モデル出力の一貫性を評価するDiscoScore、寄与率による説明性に対する人間の理解、特徴量による説明性は人間理解への貢献を検証

💡 概要

知識蒸留と枝刈りによるモデル圧縮は公平性を改善する
テキスト生成モデルの一貫性を評価するDiscoScore
寄与率による説明性に対する人間の理解について分析
特徴量による説明性は人間のモデルの性能への理解に貢献するかを検証

続きを読む

論文メモ：ブラックボックス設定のプロンプト学習、プログラム形式の推論のための事前学習POET、経済的公平さと繁栄のための民主的AI

2022-01-30に投稿2022-01-30に更新🔎 研究‍10分で読む (約1534語)

論文メモ：ブラックボックス設定のプロンプト学習、プログラム形式の推論のための事前学習POET、経済的公平さと繁栄のための民主的AI

💡 概要

ブラックボックス設定における事前学習モデルのプロンプト学習
プログラム形式のデータで事前学習された推論手法POET
経済的公平さと繁栄を両立するための民主的AI

続きを読む

論文メモ：データ選択における著者バイアス、マルチモーダルの構造を調査、言語モデルと知識グラフを用いたQAモデル

2022-01-28に投稿2022-01-30に更新🔎 研究‍12分で読む (約1759語)

論文メモ：データ選択における著者バイアス、マルチモーダルの構造を調査、言語モデルと知識グラフを用いたQAモデル

💡 概要

テキストデータ選択手法には特定の著者の属性を優遇する
マルチモーダルモデルの事前学習データ、アテンション機構と損失関数について調査
言語モデルと知識グラフを相互に考慮したQAシステム

続きを読む