自動テキスト要約ソリューションを 2020 年 2 月から提供開始
– 「ClassCat® Text Summarizer Multilingual Edition」 –
株式会社クラスキャット (代表取締役社長:佐々木規行、茨城県取手市) は、深層学習モデルをベースとする多言語対応の自動テキスト要約ソリューション「ClassCat® Text Summarizer Multilingual Edition」を 2020 年 2 月から提供開始することを発表致しました。対応可能な言語は日本語と英語を中心におよそ 100 言語に渡り、重視する言語の要約品質をあげるためにチューニングすることも可能です。BERT と呼称される自然言語処理技術を応用しており、実装は標準的な深層学習フレームワークの最新版 TensorFlow 2.1 と PyTorch 1.3 を利用しています。
自動テキスト要約は人工知能による自然言語処理の伝統的な目標タスクですが、現代ではインターネット上で膨大なドキュメントが溢れる中、タスクの重要性が増して多くの現実的なメリットがあります。必要なドキュメントの選択を容易にするだけでなく、人間のテキスト要約よりもバイアスがかからず偏りがないという優位点もあります。
自動テキスト要約は一般に抽出型と抽象型に分けられますが、本製品は文を選択する抽出型に該当しドキュメント管理システムとして利用することも可能です。
本製品「ClassCat® Text Summarizer Multilingual Edition」は多言語に対応しています。対応可能な言語はおよそ 100 言語に渡りますが、英語と日本語については最先端モデルの適用や語彙の充実により要約品質を高めています。他の言語についてもクライアントが望まれる言語についてチューニングすることが可能です。
本製品「ClassCat® Text Summarizer Multilingual Edition」は BERT (Transformer からの双方向エンコーダ表現) と呼称される最新の自然言語処理技術やその改良版である RoBERTa をベースとするモデルを採用しており、高品質なテキスト要約が可能になっています。モデル実装は深層学習フレームワークのデファクトスタンダードである TensorFlow 2.1 と PyTorch 1.3 を利用しています。
※ BERT は “Bidirectional Encoder Representations from Transformers” の略称です。
本製品「ClassCat® Text Summarizer Multilingual Edition」の動作環境はマルチクラウドに対応しています。各種パブリッククラウド Amazon EC2、Microsoft Azure、IBM Cloud、Google Cloud Platform 上のインスタンスやベアメタルで提供されます。
GPU 装備が推奨されますが、CPU のみのインスタンスでも動作可能です。
【製品販売概要】
製品名 : | ClassCat® Text Summarizer Multilingual Edition | |
販売時期 : | 2020年02月03日 | |
販売形態 : | 直接販売・販売パートナー経由・OEM | |
販売価格 : | オープンプライス |
【動作環境】
製品名 : | ClassCat® Text Summarizer Multilingual Edition | |
OS : | Ubuntu Server 18.04 LTS | |
ハードウェア : | 各種パブリッククラウドの仮想サーバ、ベアメタルサーバ。 GPU 推奨。(CPU only でも動作可) |
◆ お問合せ
本件に関するお問い合わせ先は下記までお願いいたします。
株式会社クラスキャット |
〒300-1525 茨城県取手市桜ヶ丘 4-48-7 |
セールス・マーケティング本部 セールス・インフォメーション |
E-Mail:sales-info@classcat.com |
WebSite: http://www.classcat.com/ |
Facebook: https://www.facebook.com/ClassCatJP/ |
※ その他、記載されている会社名・製品名は各社の登録商標または商標です。