Скрыть объявление
Здравствуйте Гость! Не нашли ответа на свой вопрос? Зарегистрируйтесь на форуме, чтобы стать полноценным участником сообщества и задайте свой вопрос! Вам обязательно помогут!

Где брать текст для дорвея?

Тема в разделе "Сайтостроение, настройка и технические вопросы", создана пользователем Vasiaka, 22 сен 2017.

  1. kirhost

    kirhost Пользователь

    Сообщения:
    738
    Симпатии:
    0
    Чат закрыт от индексирования?
     

  2. kirhost

    kirhost Пользователь

    Сообщения:
    738
    Симпатии:
    0
    Скан? Долго жить не будет.
     
  3. Ganad

    Ganad Пользователь

    Сообщения:
    3.253
    Симпатии:
    0
    Да просто у нас форум наполнен высокоинтеллектуальными постами, сидел от нечего делать пришел к мысли что это надо както использовать в корысных целях)))
    ЗЫ имел ввиду форум в моей локалке)))
     
  4. kratur

    kratur Пользователь

    Сообщения:
    2.894
    Симпатии:
    0
    скан геморойно распознавать. и времени следственно больше.
    бери книжки как тут написано или схожим образом и не парься, это рабочий вариант
     
  5. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    Жди пока спартанец или кто-нибудь еще запилит постилку в форумы и передирай ресурс для сапы. Ну или сам че-нить реализуй подобное.

    Вообще на форуме где-то ссылка была на один такой ресурс, который парсит все рунетовские форумы и у себя постит. А для доров это - дрочь.
     
  6. kirhost

    kirhost Пользователь

    Сообщения:
    738
    Симпатии:
    0
    А кто его знает от куда брались высокоинтеллектуальные посты, мож с других ресурсов.
     
  7. kirhost

    kirhost Пользователь

    Сообщения:
    738
    Симпатии:
    0
    И долго жить это все будет? Набор слов и то дольше будет.
     
  8. kirhost

    kirhost Пользователь

    Сообщения:
    738
    Симпатии:
    0
    Где все в индексе)
     
  9. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    Месяц спокойно. А то и два-три.
     
  10. kirhost

    kirhost Пользователь

    Сообщения:
    738
    Симпатии:
    0
    Молодца) Но все же для меня текстовка и скан одно и то же. Тут как кому повезет. Столкнулся был с таким делом и полный налом) А вот с синонемайзером работал то по пол года жили, но правда гс а не доры, но я думаю большой разницы для индекса нет)
     
  11. kirhost

    kirhost Пользователь

    Сообщения:
    738
    Симпатии:
    0
    И много за месяц на рубаешь? Текст загнаный в синонемайзер и то дольше жить будет) Было штук 5 гс, то держались максимум 2 недели, хоть и оригинальные еще тексты были,и то сразу банн.
     
  12. sergeevich

    sergeevich Пользователь

    Сообщения:
    1.998
    Симпатии:
    0
    да мне просто интересно стало, если библиотека на 100 гигов то она кому та нужна... нафига книг то столько)))) НЕ перечитаешь за всю жизнь. А для доров и 2 гигов с головой чистого должно зватить
     
  13. persistent

    persistent Guest

    Зачем нужно брать именно fb2-формат, а не готовый txt?
     
  14. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    Ты сам пишешь, что вылетал даже уник. Может не там копаешь?
     
  15. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    У меня живы еще октябрьские доры на такой текстовке. У нас тут не серч и никто теории не толкает.
     
  16. asfvanasf

    asfvanasf Пользователь

    Сообщения:
    4.270
    Симпатии:
    0
    не ну раньше делали же 1кб на пагу, я прям помню в статье паравоза так было написано) так что гб - всего лишь на мильон паг)

    а щас да, некоторые вон ваще без текста доры делают)
     
  17. kirhost

    kirhost Пользователь

    Сообщения:
    738
    Симпатии:
    0
    Копал везде, но проблема только в текстах без униках) Только перестал ими пользоваться все идет пучком)
     
  18. sergeevich

    sergeevich Пользователь

    Сообщения:
    1.998
    Симпатии:
    0
    по мне так всё равно. одну базу взял и гоняешь её 100500 раз
     
  19. meloman

    meloman Пользователь

    Сообщения:
    334
    Симпатии:
    0
    1-2 гигабайта-зачем так много. У меня в папке ******* валяется текста на 200мб, с головой хватает, в индекс лезет, и в топ.
     
  20. IBlackPraktik

    IBlackPraktik Пользователь

    Сообщения:
    1.131
    Симпатии:
    0
    меня мучал вопрос)
    есть например чищеная текстовка, пускай гигов 5.
    я разбиваю эти 5 гигов на кусочки)
    и их соотведственно юзаю в доргене.
    вот этот кусок текста сколько раз можно использовать?
    то есть на какое количество доров?

    У меня большого опыта нет - но когда пробовал - я незаметил разницы,
    или 1один раз задействовать или 5(больше не пробовал)
     
Черновик сохранён Черновик удалён
Загрузка...