GDSC Osaka Univ.

Projects

ML資料翻訳プロジェクト

概要

ML 学習資料翻訳プロジェクトは、情報系の学部生をメインターゲットとして機械学習を勉強する機会を日本語で提供することを目的に、GDSC のリソースである学習資料「Explore ML DSC」の日本語への翻訳を行ないました。

翻訳作業は機械学習に対する理解を深める良い機会であるだけでなく、日本の GDSC コミュニティへ貢献する GDSC ならではの貴重な機会です。当初は GDSC の Lead を中心に翻訳を行う想定でしたが、コミュニティのメンバーから機械学習に興味がある人を募り、一緒に学習と議論をしながら翻訳を行うという方針に転換し、その翻訳作業を GDSC 大阪大学が担当することとなりました。

参加者

翻訳担当

  • L1: Jumpei Nagai (医学部, B2)
  • L2: Kohei Hirata (情報科学研究科, M1)
  • L3: Sora Tahira (工学部, B3)
  • L4: Ryo Shirai (工学部, B3)
  • L5: Atsuhiro Hada (情報科学研究科, M1)
  • L6: Kohei Miura (基礎工学部, B3)

アドバイザー

  • Sho Tanaka (Google Japan Inc.)
  • Watru Hirota (Stockmark Inc.; 大阪大学 OB)
  • Naoya Yoshimura (大阪大学 情報科学研究科, D2; GDSC Osaka Univ. Lead)

表示の学年は、2022 年 3 月時点のものです。


事後レポート (プロジェクトの詳細)

Reported by Naoya Yoshimura (GDSC Lead; 2021-2022)

プロジェクトの概要と始めた経緯

ML 学習資料翻訳プロジェクトは、情報系の学部生をメインターゲットとして機械学習を勉強する機会を日本語で提供することを目的に、GDSC のリソースである学習資料「Explore ML DSC」の日本語への翻訳を行ないました。

10 月の GDSC 会津の山田さん、GDSC 慶應の高比良さんの呼びかけをきっかけに本プロジェクトがスタートしました。

翻訳作業は機械学習に対する理解を深める良い機会であるだけでなく、日本の GDSC コミュニティへ貢献する GDSC ならではの貴重な機会です。当初は GDSC の Lead を中心に翻訳を行う想定でしたが、コミュニティのメンバーから機械学習に興味がある人を募り、一緒に学習と議論をしながら翻訳を行うという方針に転換し、その翻訳作業を GDSC 大阪大学が担当することとなりました。

翻訳作業の目的 (何のために翻訳を行うのか?)

GDSC 大阪大学の活動目標の一つに「研究活動のための情報収集の支援」があります。 4 月に新 B4 は研究室に配属され、研究を始めることになります。昨今では機械学習を扱うテーマも多くなっていますが、研究室に網羅的な機械学習のチュートリアルが用意されているわけではなく、何ができるかよくわからないまま使っているケースも多くないように思います。

GDSC 大阪では、このような新 B4 を中心とした情報系の学生に、ML の概要の理解と、さまざまな応用分野に触れる機会を提供する勉強会の実施を検討しています。 この勉強会の教材として使用するため、「Explore ML DSC」の翻訳作業を行いました。

このような似た状況は他の大学でも十分に考えられると思いますので、阪大だけでなく他の大学でも活用していただきたいと思います。 また、現状は大阪大の B4 を想定して作成していますので、情報系の学生以外の学生を対象にイベントを行う場合があれば、ぜひその際のフィードバックをお願いしたいと思います。

経過

  • 2021-12-19: Kickoff Meeting (情報科学研究科)
  • 2022-01-13: 編集会議 1 (情報科学研究科 C401 + Google Meet)
  • 2022-01-14: もくもく会 (Google Meet)
  • 2022-02-11: 編集会議 2 (Google Meet)
  • 2022-03 初旬: 翻訳完了
  • プロジェクトの公開 ... Work-in-Progress

12 月初旬より、主に GDSC 大阪大学が本プロジェクトを引き受け、プロジェクトメンバーの募集を開始しました。B3 から M1 のメンバー 6 名が参加を表明してくださり、12 月 19 日のキックオフミーティングで担当するスライドを決め、翻訳作業を開始しました。

翻訳作業は、個人作業の他に「編集会議」という、各自で翻訳されたものをレビューするミーティングを 2 回行いました。 編集会議では、日本語訳の問題だけではなく、各自の視点で、わかりにくい単語や表現などにも踏み込んで議論を行い、勉強会で使用しやすい資料の作成を目指しました。

また、編集会議には、外部から田中さん (Google)、広田さん (Stockmark Inc, 大阪大学 OB)の 2 名に参加して頂きました。 田中さんには、日本語訳に関するアドバイスのほか、原文の意図をできるだけ汲み取るといった技術書翻訳の考え方などに関してアドバイスをいただきました。また、NLP がご専門である広田さんには、Lesson 5 & 6 を中心とした、NLP の専門用語や補足の説明などのアドバイスをいただきました。 私を含めて学生である参加者にとって、お二人とのディスカッションは、技術的な内容だけでなく、ユニニークなバックグラウンドなどからキャリアの面でも刺激になったのではないかと思います。

およそ 3 か月に及ぶプロジェクトは、2 回目の編集会議の後、体裁を整えるなどの作業をおこない、完了しました。

翻訳ポイント

本プロジェクトで翻訳した資料は、B4 を中心とする情報系の学生をターゲットした勉強会に使用する予定です。 Intermediate Track は、B3 までの授業だけでは理解が難しいと思われる箇所がありました。

翻訳では、B3 までの授業で扱われない内容や、理解が難しいと思われる箇所には、積極的にスライドへの補足や、リンク集に参考文献の追加を行いました。 修正を加えたスライドには「GDSC Osaka Univ. Edit」、新規追加したスライドには「GDSC Osaka Univ. Original」のヘッダーを追記しました。

GDSC Osaka Univ. Edit」の例

  • 専門用語の補足: optimizer, metrics
  • 構築したモデルのブロック図
  • パラメータの意味

GDSC Osaka Univ. Original」の例

  • データセット・タスクの説明 (MS COCO dataset, IMDB dataset, Image Captioning)
  • モデルの全体像 (Lesson 5)

参加者の感想

プロジェクト終了後に行った参加者 (Translator)へのアンケートを実施しました。

  • 「Q1: 今回のプロジェクトに参加して、どのくらい満足していますか?」 (5 段階評価) ... 4.8
  • 「Q2: 翻訳作業を通して、機械学習に関する理解は深まりましたか?」 (5 段階評価) ... 4.3

このように参加者の皆様からは非常に高い評価を頂きました。 この結果からも本プロジェクトの目的を達成できたこといえると思います。


以下に参加者から頂いたコメントを抜粋して紹介いたします。

  • 翻訳の難易度
    • “専門用語等も出てくるので、勉強にはちょうど良い難易度でした”
  • 本プロジェクトを通して得られた知識
    • “TensorFlow 自体や、その中身・動きについて学べました”
    • “機械学習を利用した問題解決のプロセスを学べた”
    • “自然言語処理に関する知識を身につけることができた”
  • 本プロジェクト全体に対する意見・感想
    • “スライドの作成方法や、tensorflow についてなど普段授業では意識できない事を色々体験させて頂き、為になることが多かった。また、GDSC の方々はもちろん、周りの先輩方が優しくサポートしてくださったので、置いて行かれる心配もなくやりやすかった。”

今後の予定

翻訳した資料を用いた勉強会を実施の予定しております。詳細は以下のページをご覧ください!