ブログ - GoogleがAIのためにスクレイピングする宣言
Twitterがスクレイピング対策をしたことでログインしてないと,あるいはログインしていても1日に参照できる記事数に制限を加えたということで利用者は大混乱しているようだけれど,Googleはスクレイピングは全力だと宣言した模様.
「オンラインで公開されたものすべてをAIのためにスクレイピングする」とGoogleが発表
https://gigazine.net/news/20230704-google-scrape-everything/
引用: Googleなどの検索エンジンは,クローラー,スパイダーなどと呼ばれるボットによって定期的にインターネット内を巡回し,データを取得し整理してランキングしてきたわけなので,データを集める行為は今までと変わらないと思うけどな.
従来型のクローリングとスクレイピングの違いは,不要な情報を除去して重要な情報のみ取り出す技術の模様.データウェアハウスで言うところのクレンジング(磨き上げる)ともちょっとニュアンスが違う感じか.
「オンラインで公開されたものすべてをAIのためにスクレイピングする」とGoogleが発表
https://gigazine.net/news/20230704-google-scrape-everything/
引用:
2023年7月1日にGoogleがプライバシーポリシーを変更し、「GoogleのAIモデルのトレーニング」のために「一般に公開される情報」を使用すると明言したことが分かりました。記事作成時点で、このプライバシーポリシーはアメリカ国内向けに発行されています。
従来型のクローリングとスクレイピングの違いは,不要な情報を除去して重要な情報のみ取り出す技術の模様.データウェアハウスで言うところのクレンジング(磨き上げる)ともちょっとニュアンスが違う感じか.