講演情報
[1J3-GS-10d-06](スポンサー)PLaMo Translate: PFNの開発する翻訳特化大規模言語モデル
今城健太郎1、平野正徳1 (1. 株式会社Preferred Networks)
大規模言語モデル(LLM)の発展により、自然言語処理タスクの性能は飛躍的に向上したが、翻訳タスクに特化したモデルの最適化は依然として課題である。本研究では、日本語と英語の翻訳に特化した大規模言語モデル「plamo-2-translate」を提案する。提案モデルは、専用のフォーマットを活用した入出力制御、対訳コーパスと合成データを用いたファインチューニング、Iterative DPOによる最適化を組み合わせ、流暢で文脈に即した翻訳を実現する。評価実験では、BLEU、chrF、BERTScore、COMET、GEMBA-MQMなどの複数の指標において、ベースモデルや他のLLMと比較して同等以上の性能を達成し、特に人間の評価に近いGEMBA-MQMで顕著な改善を確認した。さらに、文体指定やコンテキスト保持などの機能を備え、多様な翻訳ニーズに対応する。本研究で構築したモデルは、Huggingfaceを通じて公開しており、そのほかもSaaSやオンプレミス提供など様々な形態での提供を行っている。
参考文献:https://jxiv.jst.go.jp/index.php/jxiv/preprint/view/1461
PLaMo翻訳:https://translate.preferredai.jp/
参考文献:https://jxiv.jst.go.jp/index.php/jxiv/preprint/view/1461
PLaMo翻訳:https://translate.preferredai.jp/
コメント
コメントの閲覧・投稿にはログインが必要です。ログイン
