What we do 私たちにできること

サービス・テクノロジー・
プロダクト

システートソリューションズは、「言葉」の課題解決に特化したソリューション開発の会社。「言葉のプロフェッショナル」「言葉を処理する技術のプロフェッショナル」「言葉にまつわる業務分析のプロフェッショナル」が集まる会社だからこそできることがあります。日々の研究開発の成果を「プロダクト」としてまとめあげ、お客様のニーズに迅速に、機動的に対応できる仕組みを作り上げています。

Our products

  1. 1 自然言語技術基盤
  2. 2 システム化技術
  3. 3 アプリケーション
  4. 4 ベストプラクティス
  5. 5 業務分析・運用支援

1 自然言語技術基盤
言葉に関する豊富な知見を凝縮し、汎用性の高い「ソフトウェア部品」を構築。システートソリューションズが提供する価値の基盤として位置付けられている。
2 システム化技術
自然言語技術基盤のパワーを業務に活用するためには欠かせないシステム化のノウハウの数々。
3 アプリケーション
「自然言語技術基盤」×「システム化技術」の組み合わせにより、さまざまな言葉のニーズに対応できる多様なアプリケーションシステムをラインナップ。
4 ベストプラクティス
言葉の「技術」と言葉の「業務」の両方に精通しているからこそ蓄積できた知見の数々。これらをまとめあげたベストプラクティス。
5 業務分析・運用支援
まずお客様のコンテンツ、ドキュメントを分析。その特性と課題を洗い出すと同時に、言葉が生み出されている現行業務も分析。

1 自然言語技術基盤

言葉に関する豊富な知見を凝縮し、汎用性の高い「ソフトウェア部品」を構築。システートソリューションズが提供する価値の基盤として位置付けられている。

  1. 1.1 Cistate NLP Collection

    テキスト処理・自然言語処理を行うシステートのコアとなるスクリプト群。ひとつひとつのスクリプトは、特定目的の処理を行う。「校正処理」「整形処理」「分類処理」「分離処理」「注釈処理」の 5 タイプがあり、100 を超えるスクリプトが用意されている。各スクリプトは、別プログラムに組み込むことのできる関数の形をとっており、入出力が標準化されている。

  2. 1.2 Cistate NC Parser

    NC は Noun Cluster の略。文を解析し、文の中で可変性の高い名詞句を特定。文を「骨格部」と「可変部」に分離できる。可変部を用語とみなし、頻出用語の抽出に使用したり、文の骨格を「文型」とみなし、頻出文型分析を行なったりすることができる。Cistate Text DB との組み合わせで、可変部対応 TM としても利用できる。日本語と英語に対応。

  3. 1.3 Cistate Text DB

    テキスト(語句・文章)の格納・検索に特化したデータベースシステム。テキストの「全文検索」「曖昧検索」が可能で、REST API 経由で多様な条件でテキストデータにアクセスできる。翻訳メモリーの基盤技術としても使用可能。「コンテキストマッチ」「ファジーマッチ」の機能ももつ。スキーマレスでアジャイルに導入ができることが特長。

  4. 1.4 Cistate Files Parser

    文書ファイルの「骨格」を残しながら、「テキスト」部分のみを取り出す。取り出された「テキスト」を加工したのち、元の文書の構造と書式を保持したまま、加工後のテキストを元の文書ファイルに戻すことができる。HTML、XML、Microsoft Word、Microsoft Excel、Microsoft PowerPoint に対応。取り出されたテキストは、JSON 形式または XLIFF 形式で出力できる。

2 システム化技術

自然言語技術基盤のパワーを業務に活用するためには欠かせないシステム化のノウハウの数々。

  1. 2.1 Cistate Batch Platform

    時間のかかるファイルの整形処理・照合処理・変換処理を非同期で行うためのプラットフォーム。入力とするファイルを Web ベースのインターフェイスでアップロードでき、処理が完了すると、メール通知が送信される。アカウント (ID とパスワード) をもつユーザーだけがセキュアにログインでき、処理の状態を確認できる一覧画面も用意される。Box との連携にも対応。

  2. 2.2 REST API サーバーの構築

    セキュアな REST ベースの API サーバーを迅速に立ち上げるためのノウハウ。自然言語処理の技術基盤を外部システムから利用できる状態にするための必須技術。

  3. 2.3 認証基盤・権限基盤の構築

    Microsoft 365 認証をはじめ、安全性の高い認証基盤を組み込み、高度な権限管理を実現するための基盤。

  4. 2.4 Box 連携

    エンタープライズでの利用実績がファイル共有システムである Box。すでに Box でのファイル管理・ファイル共有が活用されている現場では、Box の豊富な API を活用したシステム連携を実現可能。

3 アプリケーション

「自然言語技術基盤」×「システム化技術」の組み合わせにより、さまざまな言葉のニーズに対応できる多様なアプリケーションシステムをラインナップ。

  1. 3.1 Cistate Text Proof

    文章の自動校正を行う。日本語と英語に対応。REST API 版と Cistate Batch Platform 版がある。Cistate Batch Platform 版では、Cistate Files Parser も組み込まれ、ファイルを入力として受け付けることができ、校正結果は Excel 形式のレポートとして出力される。

    Cistate NLP Collection として用意されている 100 を超える校正スクリプトの中から自由に組み合わせて校正処理を実装できるほか、企業固有の校正処理を独自実装して組み込むことも可能。

  2. 3.2 Cistate Text Normalizer

    文章の自動整形を行う。日本語と英語に対応。REST API 版と Cistate Batch Platform 版がある。Cistate Batch Platform 版では、Cistate Files Parser も組み込まれ、ファイルを入力として受け付けることができ、書換結果は元のファイルの形式で出力される。書換ログは、Excel 形式のレポートとして出力される。

    Cistate NLP Collection として用意されている 100 を超える整形スクリプトの中から自由に組み合わせて整形処理を実装できるほか、企業固有の整形処理を独自実装して組み込むことも可能。

  3. 3.3 Cistate TM Browser

    翻訳メモリー (TM) の閲覧・検索・編集ができる Web ベースのアプリケーション。Cistate Text DB のフロントエンドとして機能し、TMX 形式のファイルのインポートとエクスポートに対応。

  4. 3.4 Cistate Translation Editor

    Web ベースの「翻訳」エディターアプリケーション。Cistate Text DB のフロントエンドとして機能する。Web ベースのグリッドインターフェイスで翻訳を閲覧・検索・編集ができる。翻訳メモリー、対訳用語集を Cistate Text DB に取り込んでおくことにより、翻訳メモリー、対訳用語集と連携させながら訳文の入力・編集が可能。XLIFF のインポート・エクスポートに対応。

  5. 3.5 Cistate Controlled Editor

    Web ベースの「執筆支援」エディターアプリケーション。Cistate Text Proof と連携し、リアルタイムに入力テキストを校正する。Cistate NC Parser + Cistate Text DB との連携により、文骨格レベルでの文体規制、用語の規制も可能。

  6. 3.6 Cistate Translation Steroid

    機械翻訳エンジンの「ラッパー」となる REST API。Google Translate、Microsoft Translate、DeepL に対応。キャッシュ機能を有し、同一原文テキストはキャッシュから訳文を取り出す。キャッシュの有効期間も指定可能。Cistate Text DB に格納された翻訳メモリーを優先キャッシュとして使うこともできる。機械翻訳エンジンの用語集機能との連携も可能で、機械翻訳で使用された原文用語・訳文用語の部分をハイライトすることもできる。また、用語を追加・編集したときは、その用語を原文に含む対訳をキャッシュから自動消去させることも可能。

  7. 3.7 Cistate TM Utilities

    Cistate Batch Platform を基盤とし、TM のメンテナンスを目的とする。TM を使って翻訳した後、翻訳後の Word ファイルを直接編集した場合に、その編集履歴をたどり、編集内容を TM に組み込むことができる。また、Files Parser、Text DB と組み合わせることで、XLIFF ファイルの生成、TM の適用、TM 解析などを実行できる。

  8. 3.8 Cistate Glossary Utilities

    用語集の運用保守管理に欠かせない機能を搭載したユーティリティ群。用語集の登録に適さない用語の検知、活用形の自動展開をはじめとした用語集のデータ拡張、原文と用語集とを突合して、用語集の効果を測定することも。

  9. 3.9 Cistate Bilingual Term Harvester

    日本語と英語に対応。Cistate NC Parser の出力をもとに、日英の「用語」を抽出し、統計的手法により日英の用語の対応関係を生成する。

  10. 3.10 Cistate Translation Verifier

    翻訳の自動校正を行う。翻訳 QA ツール。日本語と英語に対応。REST API 版と Cistate Batch Platform 版がある。Cistate Batch Platform 版では、XLIFF 形式のファイルを入力として受け付けることができ、校正結果は Excel 形式のレポートとして出力される。

    Cistate NLP Collection として用意されている 100 を超える翻訳校正スクリプトの中から自由に組み合わせて校正処理を実装できるほか、企業固有の校正処理を独自実装して組み込むことも可能。

  11. 3.11 Cistate Translation Proxy

    リバースプロキシーサーバーに機械翻訳処理を組み合わせることができるソリューション。Cistate Translation Steroid、Cistate Files Parser、Cistate Text DB、Cistate Text Normalizer などを組み合わせ、Web サイトを簡単に、かつ高品質に多言語化できる基盤を提供。Cistate Translation Editor を使うことで、機械翻訳をレビューし、編集することも可能。

  12. 3.12 Cistate Image DB

    画像の格納・検索に特化したデータベースシステム。画像ファイルを入力とし、一致する画像をデータベースの中から特定できるほか、画像に対する曖昧一致検索もサポートする。画像を「下地」と「キャプション」に分離し、下地に対する画像検索、キャプションに対するテキスト検索も実施できる。

4 ベストプラクティス

言葉の「技術」と言葉の「業務」の両方に精通しているからこそ蓄積できた知見の数々。これらをまとめあげたベストプラクティス。

  1. 4.1 Cistate Writing Guidelines, Japanese

    英語への翻訳しやすさ(可訳性)を強く意識した日本語スタイルガイド。翻訳メモリー、機械翻訳の利活用を想定し、文字・記号・語句・文構造・文書構造のそれぞれの次元で考慮すべきポイントを整理。

  2. 4.2 Cistate Writing Guidelines, English

    多言語への翻訳しやすさ(可訳性)を強く意識した英語スタイルガイド。翻訳メモリー、機械翻訳の利活用を想定し、文字・記号・語句・文構造・文書構造のそれぞれの次元で考慮すべきポイントを整理。

  3. 4.3 Cistate Terminology Guidelines

    主に機械翻訳への適用を考慮し、機械翻訳での適用効果を最大化できる用語集の構築・保守のノウハウをまとめたガイドライン。

  4. 4.4 Cistate NLP Analytics Framework

    原文データの特性・品質を「可訳性」の観点から総合的に分析するためのフレームワーク。文字・記号・語句・文・文書のそれぞれのレベルから、出現頻度・揺れ・可訳性を網羅的に分析できる。

5 業務分析・運用支援

まずお客様のコンテンツ、ドキュメントを分析。その特性と課題を洗い出すと同時に、言葉が生み出されている現行業務も分析。

  1. 5.1 テキスト分析

    Cistate NLP Analytics Framework の手法にもとづき、テキストデータの特性・品質を総合的に分析するサービス。翻訳・機械翻訳の品質に課題がある場合、その多くは「原文側」の特性の問題として考えることができる。文字・記号・語句・文・文書のそれぞれのレベルから、テキストデータの特性と品質を分析し、顧客課題に対する「言葉」の面での施策を報告書としてまとめあげる。

  2. 5.2 機械翻訳品質評価分析

    機械翻訳の品質評価には BLEU という指標が使われることが多いが、BLUE の指標からは機械翻訳の品質改善のポイントを検討することができない。機械翻訳品質評価分析では、人間評価者により、主に正確性 (adequacy) の観点から文単位で翻訳品質をスコア付けし、低品質と評価された文について、原文側の表現特性に着目して、その原因を考察する。また、翻訳品質改善施策の立案も行う。

  3. 5.3 業務分析

    テキストの「特性・品質」の現状課題 (AS IS) とあるべき姿 (TO BE) を考えるとき、なぜそのような現状にあるのか、なぜその姿を目指すのか、テキストが作られる現場、テキストが展開される現場の業務を分析することによって、はじめて答えを得ることができる。言葉の課題も熟知したエキスパートが、業務の側の分析を通じて、テキストの「品質」のみならず、「コスト」「スピード」の改善ポイントをまとめあげる。

Contact us お問い合わせ