Текст для дорвеев – Где брать?

25.02.2011

Текст для дорвеев – Где брать?

Здравствуйте! Вот решил продолжить тему с прошлого поста о том, где брать текст для дорвеев, и как его уникализировать.

Есть задача: создать дор на 300 страниц, по 400 слов на каждой странице. Пусть в одном слове в среднем 5 букв, а это значит 5*400*300 = 600 тысяч символов, тоесть 0,5 мегабайта текста. Есть вариант написать самому, но это дибильный вариант, даже если писать не в тему и криво. Тут нужно напарсить чужой контент и сгенерировать в уникальный.

  • Первый этап – это добыча чужого контента. Если его немного, то можно просто ввести кейворд в google и начать скатывать статьи. Проще всего это делается с адалт тематикой, в сети полным полно эро рассказов, так что напарсить текста по этой теме вопросов не будет. Что касается других тематик, где статей много не напишешь,  можно найти другой выход. Есть у хуЯндекса сервис блоги, там осуществляется поиск указанного кейворда по разнообразным блогам, так есть больше шансов найти подходящую тематическую инфу для будушего дора.Но есть и другой вариант, но пока еще не проверен мною. Допустим есть сайт в котором много страниц интересующей вас тематики. Их нужно стырить. Так вот, как рассказывалось на одном блоге, нужно сначала сохранить весь сайт, для этого есть прога специальная «Телепорт» вроде, далее на Денвере или другом эмуляторе веб-сервера выполняем слудующий php скрипт:[sourcecode language=’PHP’]
  • $dir=»dir»;

    $indexfile=»data.txt»;function text_2_base($url, amp;$baza)

    {

    $fd = fopen (‘http://phpdirtobase/dir/’.$url, «r»);

    while (!feof($fd))

    {

    $htmltotext = fgetss($fd, 1000);

    fwrite($baza, $htmltotext);

    }

    fclose ($fd);

    }

    $fp = fopen($indexfile, «w+»);

    if (is_dir($dir)) {

    if ($dh = opendir($dir)) {

    $i = -2;

    while ((($file = readdir($dh)) !== false))

    {$i++;

    if ( $file != «.» amp;amp; $file != «..»)

    {

    echo $i.’ obrabotan : ‘.$file. ‘‘;

    text_2_base($file, $fp);

    }

    }

    closedir($dh);

    }

    }

    fclose($fp);

    [/sourcecode]

    Там мы указывем в пееременной $fd путь к папке со страничками и запскаем php скрипт. Лчно я не проверял, так что не могу сказать как это работает, но если есть желание – пробуйте.

  • После того как напарсили, его нужно перемешать. Если вы работете с доргеном Red.Button, то этот этап дорген сделает за вас. В нем есть замещательная функция перемешивания и генерации текста. Выбираем алогитм генерации – «офигенный», читаемость – «Отличная». С такими настройками дорген выдаст вам отличный, уникальный и даже более-менее читаемый текст. Ну а для тех, кто использует другой дорген, рекомендую прогамму для генерации текстов — Generating The Web. Полное описание программы лежит на серче, сам пока еще не делал ее обзор, но в будущем планирую. Кстати, эта прога подойдет и для тех, кто увлекается сателлитами.
  • После того как мы напарсили много много текста и перемешали его, начинаем работу с кейвордами, но о них речь пойдет в следующей статье.