サイト内の現在位置を表示しています。

Talend - 特長/機能

データ移行/データ統合/データ連携プロジェクトの連携基盤

Talendの特長

  1. 高い生産性を発揮する開発環境
    • GUIベースの開発環境のため、プログラミング不要。
    • 部品をドラッグ&ドロップして組み合わせ、様々な処理を開発可能。
  2. コードジェネレーション方式
    • GUIで開発したETL処理をJavaのソースコードとして出力可能。
    • 生成したJavaソースの確認ができる、透明性の高い実装モデル。
  3. 標準・普及技術への準拠
    • JavaやEclipse、Subversionといった一般に普及している技術を利用。
    • 開発者の立ち上げがスムーズ。
  4. 運用を支える統合監視機能
    • 運用監視機能を備えており、ブラウザベースのツールから処理の監視や制御が可能。
  5. 実行ジョブのエクスポート
    • 成果物のJarファイルとライブラリのみをエクスポートすることが可能。
    • Talendの制御系抜きで単体のプログラムとして動作させられるため、自由度が高い運用形態。
  6. サブスクリプションライセンス
    • 必要なときに必要な分だけのライセンスを購入可能。
    • 開発や運用など各フェーズに適したソフトウェア購入量による、低コストでの導入・運用。

Talendの機能

  1. 高い開発生産性を発揮する開発作業環境「Talend Studio」
    • 800以上の処理コンポーネント。
    • デザインエリア上へドラッグ&ドロップし、組み合わせることが可能。
    • EclipseベースのGUIでプログラムレスにデータの読み取り→変換→書き込み処理を開発。
    • チームで共同開発できる、成果物を共有可能なリポジトリ。

    Talend Studuio
  2. パーティションパラレル機能
    • 大量データの高速一括処理を実現する、マルチスレッドを活かしたパーティション分割。

    パーティションパラレル機能
  3. 高可用性機能(フェールオーバー・ロードバランシング)
    • 複数の実行サーバをクラスタ(仮想サーバ)化。
    • それぞれのクラスタに対してタスクの割り当てが可能。

    フェールオーバー・ロードバランシング
  4. 運用を支える統合監視機能「Talend Administration Center(TAC)」
    • Webベースの管理コンソールによる、Talend Studioで開発したジョブの運用管理機能。
      • コンパイル&デプロイ。
      • 実行スケジュールの作成・監視。
      • ユーザーごとのロール管理。
      • ジョブを分散実行させるための複数サーバーの一元管理。

    Talend Administration Center(TAC)
  5. 運用管理を支援するTalendのモニター機能
    • 実行タスクの稼働状況を監視する「リアルタイムモニタリング機能」。
    • スケジュール状況とタスクの成功・失敗を表示する「リストビュー」、「グラフィックビュー」。

    モニター機能
  6. Talend Data Quality機能
    機能名 概要
    プロファイリング機能 データのクオリティ分析により、現状確認を行う機能
    クレンジング機能 非構造データを構造化するパーサー機能と商用のデータ辞書やリファレンスを利用した標準化により、表記の統一を行う機能
    マッチング機能 重複レコードの特定や、What-if分析によるマッチングロジック最適化を行う機能
    スチュワードシップコンソール Webブラウザベースのコンソール。業務担当者による標準化作業を支援が可能
    モニタリング機能 レポートをPDF, HTML, XMLフォーマットで作成可能。Webブラウザベースのポータルでモニタリングとサポート作業を支援

  7. TalendのHadoop Map Reduceジョブ開発機能
    • Hadoop環境にあるデータに対しても、Talend Stdioで開発したジョブを実行可能。
    • 高生産性を実現する、GUIを利用したMap Reduce処理の開発と運用。
      • Talend Studio上で処理コンポーネントを組み合わせ、Map Reduceの処理を開発。
      • Talend Administrator Centerから、Oozieベースのジョブフロー運用が可能。

    ジョブ開発機能