# Node.js (Google Cloud Functions)でDocument AIを使ってOCRを実装する

## はじめに

紙の書類や画像データをデジタル化し、テキストデータとして活用するOCR（光学文字認識）は、業務効率化において重要な技術です。Google CloudのDocument AIは、そのOCR機能を強力にサポートするサービスです。本記事では、Node.jsとGoogle Cloud Functionsを使ってDocument AIを活用し、OCRを実装する方法を紹介します。

---

## 必要な準備

### 1. Google Cloudプロジェクトのセットアップ

1. **Google Cloud Console**で新しいプロジェクトを作成します。
2. 「APIとサービス」で**Document AI API**を有効にします。
3. 「認証情報」からサービスアカウントを作成し、JSON形式でキーをダウンロードします。このファイルをCloud Functionsで使用します。

### 2. 必要なNode.jsパッケージをインストール

ローカル環境で以下のコマンドを使用してモジュールをインストールします：

![img](/mosaic-code.jpg)

- **@google-cloud/documentai**: Document AIを操作するためのライブラリ。
- **@google-cloud/storage**: Google Cloud Storageとの連携をサポート。

---

## 実装手順

### 1. Cloud Functionsでの基本構造

Cloud FunctionsでのOCR処理を実現するために、エントリーポイントを作成します。以下のように`index.js`を用意します。

#### index.js

![img](/mosaic-code.jpg)

### 2. デプロイメント

Cloud Functionsにデプロイするには以下のコマンドを使用します：

![img](/mosaic-code.jpg)

### 3. リクエスト送信

リクエストには、Cloud Storageにアップロードしたファイル名とDocument AIのプロセッサ情報が必要です。以下の例を参考に、cURLまたはPostmanを使用してリクエストを送信します：

![img](/mosaic-code.jpg)

---

## 注意点

1. **適切なIAMロール**: Document AIのサービスアカウントに必要なIAMロール（`Document AI Editor`など）を付与してください。
2. **Cloud Storageへのファイルアップロード**: OCRを行う対象ファイルを事前にCloud Storageにアップロードする必要があります。
3. **エラーハンドリング**: ネットワークエラーや認証エラーを適切に処理することで、スムーズな動作を確保します。

---

## まとめ

Node.jsとGoogle Cloud Functionsを使用してDocument AIを利用することで、強力なOCR機能を簡単に実装できます。スケーラブルなアーキテクチャを活用しながら、高精度な文字認識を実現できます。本記事を参考に、業務やプロジェクトでの効率化を図ってみてください！



# Node.js (Google Cloud Functions)でDocument AIを使ってOCRを実装する

## はじめに

紙の書類や画像データをデジタル化し、テキストデータとして活用するOCR（光学文字認識）は、業務効率化において重要な技術です。Google CloudのDocument AIは、そのOCR機能を強力にサポートするサービスです。本記事では、Node.jsとGoogle Cloud Functionsを使ってDocument AIを活用し、OCRを実装する方法を紹介します。

---

## 必要な準備

### 1. Google Cloudプロジェクトのセットアップ

1. **Google Cloud Console**で新しいプロジェクトを作成します。
2. 「APIとサービス」で**Document AI API**を有効にします。
3. 「認証情報」からサービスアカウントを作成し、JSON形式でキーをダウンロードします。このファイルをCloud Functionsで使用します。

### 2. 必要なNode.jsパッケージをインストール

ローカル環境で以下のコマンドを使用してモジュールをインストールします：

```bash
npm install @google-cloud/documentai
npm install @google-cloud/storage
```

- **@google-cloud/documentai**: Document AIを操作するためのライブラリ。
- **@google-cloud/storage**: Google Cloud Storageとの連携をサポート。

---

## 実装手順

### 1. Cloud Functionsでの基本構造

Cloud FunctionsでのOCR処理を実現するために、エントリーポイントを作成します。以下のように`index.js`を用意します。

#### index.js

```javascript
const { DocumentProcessorServiceClient } = require('@google-cloud/documentai');
const { Storage } = require('@google-cloud/storage');

// サービスアカウントキーの設定
const storage = new Storage();
const documentAIClient = new DocumentProcessorServiceClient();

// Cloud Storageの設定
const BUCKET_NAME = 'your-bucket-name';

// OCR処理関数
exports.performOCR = async (req, res) => {
  try {
    const { fileName, processorId, projectId, location } = req.body;

    // Cloud Storageのバケットとファイルを参照
    const bucket = storage.bucket(BUCKET_NAME);
    const file = bucket.file(fileName);

    // Document AIリクエストの設定
    const inputConfig = {
      gcsSource: {
        uri: `gs://${BUCKET_NAME}/${fileName}`,
      },
      mimeType: 'application/pdf',
    };

    const request = {
      name: `projects/${projectId}/locations/${location}/processors/${processorId}`,
      rawDocument: inputConfig,
    };

    // OCRの実行
    const [result] = await documentAIClient.processDocument(request);
    const { document } = result;

    // 結果の処理
    const extractedText = document.text;
    console.log('Extracted Text:', extractedText);

    res.status(200).send({ extractedText });
  } catch (error) {
    console.error('Error during OCR process:', error);
    res.status(500).send('Failed to perform OCR.');
  }
};
```

### 2. デプロイメント

Cloud Functionsにデプロイするには以下のコマンドを使用します：

```bash
gcloud functions deploy performOCR --runtime nodejs18 --trigger-http --allow-unauthenticated
```

### 3. リクエスト送信

リクエストには、Cloud Storageにアップロードしたファイル名とDocument AIのプロセッサ情報が必要です。以下の例を参考に、cURLまたはPostmanを使用してリクエストを送信します：

```bash
curl -X POST -H "Content-Type: application/json"   -d '{
    "fileName": "sample.pdf",
    "processorId": "your-processor-id",
    "projectId": "your-project-id",
    "location": "us"
  }'   https://REGION-PROJECT_ID.cloudfunctions.net/performOCR
```

---

## 注意点

1. **適切なIAMロール**: Document AIのサービスアカウントに必要なIAMロール（`Document AI Editor`など）を付与してください。
2. **Cloud Storageへのファイルアップロード**: OCRを行う対象ファイルを事前にCloud Storageにアップロードする必要があります。
3. **エラーハンドリング**: ネットワークエラーや認証エラーを適切に処理することで、スムーズな動作を確保します。

---

## まとめ

Node.jsとGoogle Cloud Functionsを使用してDocument AIを利用することで、強力なOCR機能を簡単に実装できます。スケーラブルなアーキテクチャを活用しながら、高精度な文字認識を実現できます。本記事を参考に、業務やプロジェクトでの効率化を図ってみてください！


Node.js (Google Cloud Functions)でDocument AIを使ってOCRを実装する

はじめに

続きを読むには単価診断を受けてください（30秒）