Skip to content

ClasCat® AI Research

クラスキャット – 生成 AI, AI エージェント, MCP

Menu
  • ホーム
    • ClassCat® AI Research ホーム
    • クラスキャット・ホーム
  • OpenAI API
    • OpenAI Python ライブラリ 1.x : 概要
    • OpenAI ブログ
      • GPT の紹介
      • GPT ストアの紹介
      • ChatGPT Team の紹介
    • OpenAI platform 1.x
      • Get Started : イントロダクション
      • Get Started : クイックスタート (Python)
      • Get Started : クイックスタート (Node.js)
      • Get Started : モデル
      • 機能 : 埋め込み
      • 機能 : 埋め込み (ユースケース)
      • ChatGPT : アクション – イントロダクション
      • ChatGPT : アクション – Getting started
      • ChatGPT : アクション – アクション認証
    • OpenAI ヘルプ : ChatGPT
      • ChatGPTとは何ですか?
      • ChatGPT は真実を語っていますか?
      • GPT の作成
      • GPT FAQ
      • GPT vs アシスタント
      • GPT ビルダー
    • OpenAI ヘルプ : ChatGPT > メモリ
      • FAQ
    • OpenAI ヘルプ : GPT ストア
      • 貴方の GPT をフィーチャーする
    • OpenAI Python ライブラリ 0.27 : 概要
    • OpenAI platform
      • Get Started : イントロダクション
      • Get Started : クイックスタート
      • Get Started : モデル
      • ガイド : GPT モデル
      • ガイド : 画像生成 (DALL·E)
      • ガイド : GPT-3.5 Turbo 対応 微調整
      • ガイド : 微調整 1.イントロダクション
      • ガイド : 微調整 2. データセットの準備 / ケーススタディ
      • ガイド : 埋め込み
      • ガイド : 音声テキスト変換
      • ガイド : モデレーション
      • ChatGPT プラグイン : イントロダクション
    • OpenAI Cookbook
      • 概要
      • API 使用方法 : レート制限の操作
      • API 使用方法 : tiktoken でトークンを数える方法
      • GPT : ChatGPT モデルへの入力をフォーマットする方法
      • GPT : 補完をストリームする方法
      • GPT : 大規模言語モデルを扱う方法
      • 埋め込み : 埋め込みの取得
      • GPT-3 の微調整 : 分類サンプルの微調整
      • DALL-E : DALL·E で 画像を生成して編集する方法
      • DALL·E と Segment Anything で動的マスクを作成する方法
      • Whisper プロンプティング・ガイド
  • Gemini API
    • Tutorials : クイックスタート with Python (1) テキスト-to-テキスト生成
    • (2) マルチモーダル入力 / 日本語チャット
    • (3) 埋め込みの使用
    • (4) 高度なユースケース
    • クイックスタート with Node.js
    • クイックスタート with Dart or Flutter (1) 日本語動作確認
    • Gemma
      • 概要 (README)
      • Tutorials : サンプリング
      • Tutorials : KerasNLP による Getting Started
  • Keras 3
    • 新しいマルチバックエンド Keras
    • Keras 3 について
    • Getting Started : エンジニアのための Keras 入門
    • Google Colab 上のインストールと Stable Diffusion デモ
    • コンピュータビジョン – ゼロからの画像分類
    • コンピュータビジョン – 単純な MNIST convnet
    • コンピュータビジョン – EfficientNet を使用した微調整による画像分類
    • コンピュータビジョン – Vision Transformer による画像分類
    • コンピュータビジョン – 最新の MLPモデルによる画像分類
    • コンピュータビジョン – コンパクトな畳込み Transformer
    • Keras Core
      • Keras Core 0.1
        • 新しいマルチバックエンド Keras (README)
        • Keras for TensorFlow, JAX, & PyTorch
        • 開発者ガイド : Getting started with Keras Core
        • 開発者ガイド : 関数型 API
        • 開発者ガイド : シーケンシャル・モデル
        • 開発者ガイド : サブクラス化で新しい層とモデルを作成する
        • 開発者ガイド : 独自のコールバックを書く
      • Keras Core 0.1.1 & 0.1.2 : リリースノート
      • 開発者ガイド
      • Code examples
      • Keras Stable Diffusion
        • 概要
        • 基本的な使い方 (テキスト-to-画像 / 画像-to-画像変換)
        • 混合精度のパフォーマンス
        • インペインティングの簡易アプリケーション
        • (参考) KerasCV – Stable Diffusion を使用した高性能画像生成
  • TensorFlow
    • TF 2 : 初級チュートリアル
    • TF 2 : 上級チュートリアル
    • TF 2 : ガイド
    • TF 1 : チュートリアル
    • TF 1 : ガイド
  • その他
    • 🦜️🔗 LangChain ドキュメント / ユースケース
    • Stable Diffusion WebUI
      • Google Colab で Stable Diffusion WebUI 入門
      • HuggingFace モデル / VAE の導入
      • LoRA の利用
    • Diffusion Models / 拡散モデル
  • クラスキャット
    • 会社案内
    • お問合せ
    • Facebook
    • ClassCat® Blog
Menu

Agno : コンセプト :- ツールキット : Web スクレイピング (AgentQL, Browserbase, Firecrawl, Newspaper 等)

Posted on 08/03/2025 by Masashi Okumura

ツールキットはエージェントに追加できる関数のコレクションです。
ここでは、Web スクレイピング対応ツール AgentQL, Browserbase, Firecrawl, Newspaper, Newspaper4k, Oxylabs 等の使い方を説明します。

Agno : ユーザガイド : コンセプト : ツール – ツールキット : Web スクレイピング (AgentQL, Browserbase, Firecrawl, Newspaper 等)

作成 : クラスキャット・セールスインフォメーション
作成日時 : 08/03/2025
バージョン : Agno 1.7.5

* 本記事は docs.agno.com の以下のページを独自に翻訳した上で、補足説明を加えてまとめ直しています :

  • User Guide : Concepts : Tools – Toolkits : Web Scraping : AgentQL
  • User Guide : Concepts : Tools – Toolkits : Web Scraping : Browserbase
  • User Guide : Concepts : Tools – Toolkits : Web Scraping : Firecrawl
  • User Guide : Concepts : Tools – Toolkits : Web Scraping : Newspaper
  • User Guide : Concepts : Tools – Toolkits : Web Scraping : Newspaper4k
  • User Guide : Concepts : Tools – Toolkits : Web Scraping : Oxylabs

* サンプルコードの動作確認はしておりますが、必要な場合には適宜、追加改変しています。
* ご自由にリンクを張って頂いてかまいませんが、sales-info@classcat.com までご一報いただけると嬉しいです。

 

クラスキャット 人工知能 研究開発支援サービス ⭐️ リニューアルしました 😉

◆ クラスキャット は人工知能に関する各種サービスを提供しています。お気軽にご相談ください :

  • 人工知能導入個別相談会(無償)実施中! [詳細]

  • 人工知能研究開発支援 [詳細]
    1. 自社特有情報を含むチャットボット構築支援
    2. 画像認識 (医療系含む) / 画像生成

  • PoC(概念実証)を失敗させないための支援 [詳細]

◆ お問合せ : 下記までお願いします。

  • クラスキャット セールス・インフォメーション
  • sales-info@classcat.com
  • ClassCatJP

 

 

Agno ユーザガイド : コンセプト : ツール – ツールキット : Web スクレイピング : AgentQL

AgentQLTools は、エージェントが AgentQL API を使用して web サイトをブラウズしてスクレイピングすることを可能にします。

 

前提条件

後述の例は agentql ライブラリと AgentQL から取得可能な API トークンを必要とします。
​

pip install -U agentql
export AGENTQL_API_KEY=***

 

例

次のエージェントは web ブラウザを開いて、ページからすべてのテキストをスクレイピングします。

cookbook/tools/agentql_tools.py

from agno.agent import Agent
from agno.models.openai import OpenAIChat
from agno.tools.agentql import AgentQLTools

agent = Agent(
    model=OpenAIChat(id="gpt-4o"), tools=[AgentQLTools()], show_tool_calls=True
)

agent.print_response("https://docs.agno.com/introduction", markdown=True)

Note : AgentQL will open up a browser instance (don’t close it) and do scraping on the site.

 

Agno ユーザガイド : コンセプト : ツール – ツールキット : Web スクレイピング : Browserbase

BrowserbaseTools はエージェントが Browserbase – ヘッドレス・ブラウザ・サービスを使用して、ブラウザ操作を自動化することを可能にします。

 

前提条件

後述の例は、ここでサインアップした後の Browserbase API クレデンシャルと Playwright ライブラリを必要とします。

pip install browserbase playwright
export BROWSERBASE_API_KEY=xxx
export BROWSERBASE_PROJECT_ID=xxx

 

例

次のエージェントは Browserbase を使用して https://quotes.toscrape.com にアクセスし、コンテンツを抽出します。それから web サイトの 2 ページ目に移動し、そこからも引用を取得します。

cookbook/tools/browserbase_tools.py

from agno.agent import Agent
from agno.tools.browserbase import BrowserbaseTools

agent = Agent(
    name="Web Automation Assistant",
    tools=[BrowserbaseTools()],
    instructions=[
        "You are a web automation assistant that can help with:",
        "1. Capturing screenshots of websites",
        "2. Extracting content from web pages",
        "3. Monitoring website changes",
        "4. Taking visual snapshots of responsive layouts",
        "5. Automated web testing and verification",
    ],
    markdown=True,
)

agent.print_response("""
    Visit https://quotes.toscrape.com and:
    1. Extract the first 5 quotes and their authors
    2. Navigate to page 2
    3. Extract the first 5 quotes from page 2
""")

Note : View the Startup Analyst MCP agent

 

Agno ユーザガイド : コンセプト : ツール – ツールキット : Web スクレイピング : Firecrawl

Agno で Firecrawl を使用して web をスクレイピング/クロールします。

FirecrawlTools はエージェントが web クローリングとスクレイピングのタスクを実行できるようにします。

 

前提条件

後述の例は firecrawl-py ライブラリと、Firecrawl から取得できる API キーを必要とします。
​

pip install -U firecrawl-py
export FIRECRAWL_API_KEY=***

 

例

次のエージェントは https://finance.yahoo.com のコンテンツをスクレイピングして、コンテンツの要約を返します :

cookbook/tools/firecrawl_tools.py

from agno.agent import Agent
from agno.tools.firecrawl import FirecrawlTools

agent = Agent(tools=[FirecrawlTools(scrape=False, crawl=True)], show_tool_calls=True, markdown=True)
agent.print_response("Summarize this https://finance.yahoo.com/")

 

Agno ユーザガイド : コンセプト : ツール – ツールキット : Web スクレイピング : Newspaper

NewspaperTools はエージェントが Newspaper4k ライブラリを使用してニュース記事を読むことを可能にします。

 

前提条件

後述の例は newspaper3k ライブラリを必要とします。

pip install -U newspaper3k

 

例

次のエージェントは言語モデルに関する wikipedia 記事を要約します。

cookbook/tools/newspaper_tools.py

from agno.agent import Agent
from agno.tools.newspaper import NewspaperTools

agent = Agent(tools=[NewspaperTools()])
agent.print_response("Please summarize https://en.wikipedia.org/wiki/Language_model")

 

Agno ユーザガイド : コンセプト : ツール – ツールキット : Web スクレイピング : Newspaper4k

Newspaper4k はエージェントが Newspaper4k ライブラリを使用してニュース記事を読むことを可能にします。

 

前提条件

後述の例は newspaper4k と lxml_html_clean ライブラリを必要とします。

pip install -U newspaper4k lxml_html_clean

 

例

次のエージェントは記事: https://www.rockymountaineer.com/blog/experience-icefields-parkway-scenic-drive-lifetime を要約します。

cookbook/tools/newspaper4k_tools.py

from agno.agent import Agent
from agno.tools.newspaper4k import Newspaper4kTools

agent = Agent(tools=[Newspaper4kTools()], debug_mode=True, show_tool_calls=True)
agent.print_response("Please summarize https://www.rockymountaineer.com/blog/experience-icefields-parkway-scenic-drive-lifetime")

 

Agno ユーザガイド : コンセプト : ツール – ツールキット : Web スクレイピング : Oxylabs

OxylabsTools は SERP, Amazon 製品データとユニバーサル web スクレイピング・エンドポイントを含む、Oxylabs の強力な web スクレイピング機能へのアクセスをエージェントに提供します。

 

前提条件

pip install -U oxylabs-sdk

クレデンシャルを環境変数として設定します (推奨) :

export OXYLABS_USERNAME=your_oxylabs_username
export OXYLABS_PASSWORD=your_oxylabs_password

 

例

from agno.agent import Agent
from agno.tools.oxylabs import OxylabsTools

agent = Agent(
    tools=[OxylabsTools()],
    markdown=True,
    show_tool_calls=True,
)

agent.print_response("""
Search for 'latest iPhone reviews' and provide a summary of the top 3 results. 
""")

 

以上



クラスキャット

最近の投稿

  • Agno : コンセプト :- ツールキット : Web スクレイピング (AgentQL, Browserbase, Firecrawl, Newspaper 等)
  • Agno : コンセプト :- ツールキット : SNS (Discord, Email, Gmail, Slack, X 等)
  • Agno : コンセプト :- ツールキット : 検索 (Arxiv, DuckDuckGo, Exa, Google Search 等)
  • Agno : コンセプト : ツール – Human in the loop
  • Agno : コンセプト : ツール – 例外, フック

タグ

Agno (30) AutoGen (13) ClassCat Press Release (20) ClassCat TF/ONNX Hub (11) DGL 0.5 (14) Eager Execution (7) Edward (17) FLUX.1 (16) Gemini (20) HuggingFace Transformers 4.5 (10) HuggingFace Transformers 4.6 (7) HuggingFace Transformers 4.29 (9) Keras 2 Examples (98) Keras 2 Guide (16) Keras 3 (10) Keras Release Note (17) Kubeflow 1.0 (10) LangChain (45) LangGraph (24) LangGraph 0.5 (9) MediaPipe 0.8 (11) Model Context Protocol (16) NNI 1.5 (16) OpenAI Agents SDK (8) OpenAI Cookbook (13) OpenAI platform (10) OpenAI platform 1.x (10) OpenAI ヘルプ (8) TensorFlow 2.0 Advanced Tutorials (33) TensorFlow 2.0 Advanced Tutorials (Alpha) (15) TensorFlow 2.0 Advanced Tutorials (Beta) (16) TensorFlow 2.0 Guide (10) TensorFlow 2.0 Guide (Alpha) (16) TensorFlow 2.0 Guide (Beta) (9) TensorFlow 2.0 Release Note (12) TensorFlow 2.0 Tutorials (20) TensorFlow 2.0 Tutorials (Alpha) (14) TensorFlow 2.0 Tutorials (Beta) (12) TensorFlow 2.4 Guide (24) TensorFlow Deploy (8) TensorFlow Probability (9) TensorFlow Programmer's Guide (22) TensorFlow Release Note (18) TensorFlow Tutorials (33) TF-Agents 0.4 (11)
2025年8月
月 火 水 木 金 土 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 7月    
© 2025 ClasCat® AI Research | Powered by Minimalist Blog WordPress Theme