日文在线翻译

2024年11月15日 18:45
有2个网友回答
网友(1):

低洼的谷脚抹去(关闭)了树人的游谨想法,失踪于古宏枯迹之蔽磨洞中
我们只是耍耍伎俩,无声的分隔在思维的两侧

网友(2):

ネット爬虫技术
1 .何はネット爬虫?
ネットの爬虫类は、ホームページのリンクのアドレスを探してウェブサイトからあるページから読冲消带み取り、ホームページの内容をWebページ中のその他のリンクのアドレスを、そしてこれらのリンクのアドレスを探して次のページに、ずっと循环し続けて、ある策略に写真までインターネット上のすべてのページを取る完売までの技术。主にネットの资源の散芦収集。
2 .ネット爬虫类の基本的な作业の流れ:
2 - 1 .まず选取一部厳选种子URL、
2 - 2 .これらのURLを待クロールURL行列、
2 - 3 .待クロールURLから取り出し待クロールURL行列解析DNS、それがホストip URL対応のホームページをダウンロードして、メモリにはダウンロードページ库。また、これらのURLを入れてすでにクロールURL行列。
6。分析はクロールURL列にURLを分析し、そのほかのURLを入れ、そしてURL待クロールURL列に入ることによって、次の循环。
ウェブ検索戦略3。
広さ优先検索
広さ优先検索戦略は、クロールの过程の中で、完成の现在のレベルの検索した後、次の段阶の検索。ときにはなるべく多くのホームページに覆われ、一般に使用広さ优先検索方法。
最优先の検索
最优秀优先検索策略を一定のホームページ解析アルゴリズ桥渣ム、予测候补とホームページのURL目标相似度、あるいはとテーマとの関连性を评価する最高のまたはいくつかのURLを掴み取る。それだけを経てホームページを访问解析アルゴリズムを予测に「人の役に立つ」のホームページ。
深さ优先検索
深さ优先検索策からはスタートページから选べるURLに入り、分析のこのホームページの中のURLを再突入。このリンクのリンクにクロールし続けて、処理が终瞭まで路线を後にする次のルート。过ぎまで深くクロールのホームページは価値が低い。同时に、この戦略はクロールの深さに直接影响してクロール命中率やクロール効率、クロールの深さはこの种の策略の键。他の2つの策略に対し。この策略が少ない使用される。