Скрыть объявление
Здравствуйте Гость! Не нашли ответа на свой вопрос? Зарегистрируйтесь на форуме, чтобы стать полноценным участником сообщества и задайте свой вопрос! Вам обязательно помогут!

Где брать текст для дорвея?

Тема в разделе "Сайтостроение, настройка и технические вопросы", создана пользователем Vasiaka, 22 сен 2017.

  1. antoha487

    antoha487 Пользователь

    Сообщения:
    793
    Симпатии:
    0
    а точно ли можно любые книги, или в моем случае предпочтительней былобы по строительству?
     

  2. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    В прогу пихать fb2 файлы, а не архивы, что логично, исходя из названия проги.
     
  3. itasw

    itasw Пользователь

    Сообщения:
    6.655
    Симпатии:
    0
    Как-то маловато...
     
  4. antoha487

    antoha487 Пользователь

    Сообщения:
    793
    Симпатии:
    0
    а как сделать из архивов fb2?
     
  5. antoha487

    antoha487 Пользователь

    Сообщения:
    793
    Симпатии:
    0
    А сколько 10, 20?
     
  6. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    Разархивировать. Скачай winrar.
     
  7. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    Книги любые. Книг нужно метров на 150-200 склеить и в чистильщик пихать. Половину объема он уберет, так что много не будет контента.
     
  8. itasw

    itasw Пользователь

    Сообщения:
    6.655
    Симпатии:
    0
    Еще раз продублирую:
    1. Распаковываешь скачанные книги, как это сделаешь уже твои 'половые трудности'. Главное что бы на выходи ты получил туеву кучу файлов *.txt и все в одной папке.
    2. Кейвордкипером это все клеишь в один файл.
    3. Этой же прогой режешь его на куски по 100 М. И пихаешь эти куски по одному в скрипт (который на php ). На выходе получаешь почищенную текстовку (минус 50-60 % объема)
    4. Дальше все это можно опять склеить воедино и нарезать уже удобными тебе для генерации кусочками.

    У меня вышло на выходе ~ 370М текстовки которую порезал ровно на 50 кусочков.

    PS клеить и резать можно с помощью TextPipe, в разы быстрее. Да и очистку можно ему доверить. Но я в этом еще не разбирался.
     
  9. antoha487

    antoha487 Пользователь

    Сообщения:
    793
    Симпатии:
    0
    Клас! Спасибо! получается. Теперь все файлы нужно копировать и вставить в какой нибудь один?

    PS Что обозначает выражение 500-100 паг? ПАГ что это?
     
  10. antoha487

    antoha487 Пользователь

    Сообщения:
    793
    Симпатии:
    0
    получается одни и те же тексты можно в разных партнерках использовать что-ли?

    ЗЫ зато на форум будут нубы приходить и он наполнится еще больше)
     
  11. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    Паг - страниц. От буржуйского pages. Паги
     
  12. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    а ты терпеливый)
     
  13. antoha487

    antoha487 Пользователь

    Сообщения:
    793
    Симпатии:
    0
    Объединить все файлы это значит копировать/вставить все в один txt? И должно быть где-то 2 МБ?
     
  14. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    На любых. Вообще пофиг на то где использовать.
     
  15. itasw

    itasw Пользователь

    Сообщения:
    6.655
    Симпатии:
    0
    Могу еще хоть раз 100 написать
     
  16. antoha487

    antoha487 Пользователь

    Сообщения:
    793
    Симпатии:
    0
    а для чистки текста в скрипте куда сам текст пихать, в какую паку?
     
  17. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    Можно в наказание провинившихся отправлять в эту тему и пока 100 раз комунить не объяснят, вину не искупят))
     
  18. antoha487

    antoha487 Пользователь

    Сообщения:
    793
    Симпатии:
    0
    Файл с текстом нужно называть input.txt? а то мне пишет что такой файл не найден, вообще-то я называл так, все равно не найден
     
  19. itasw

    itasw Пользователь

    Сообщения:
    6.655
    Симпатии:
    0
    В настройках указываешь название файлов откуда берется текстовка и название файла после обработки.
     
  20. antoha487

    antoha487 Пользователь

    Сообщения:
    793
    Симпатии:
    0
    А если протупочка такого типа: мне кажется что я в запале 2 раза книги в файл сохранил, потому что размер сильно большой, если так и есть это сильно страшно?
     
Черновик сохранён Черновик удалён
Загрузка...