Скрыть объявление
Здравствуйте Гость! Не нашли ответа на свой вопрос? Зарегистрируйтесь на форуме, чтобы стать полноценным участником сообщества и задайте свой вопрос! Вам обязательно помогут!

Где брать текст для дорвея?

Тема в разделе "Сайтостроение, настройка и технические вопросы", создана пользователем Vasiaka, 22 сен 2017.

  1. itasw

    itasw Пользователь

    Сообщения:
    6.655
    Симпатии:
    0
    Запускаешь fb2batch, а потом делаешь финт ушами
     

  2. Ganad

    Ganad Пользователь

    Сообщения:
    3.253
    Симпатии:
    0
    Да конечно и чат и форум закрыты, они на локальном сервере лежат
     
  3. kratur

    kratur Пользователь

    Сообщения:
    2.894
    Симпатии:
    0
    да, будет уникальна.
    только никому не будет нужна такая уникальность, особенно псам)))
     
  4. kratur

    kratur Пользователь

    Сообщения:
    2.894
    Симпатии:
    0
    попробуй утилитку kaboom погуглить, ей вроде делал когда необходимость была
     
  5. rementese

    rementese Guest

    Теперь какая то фигня со скриптом по чистке текста.

    Fatal error: Allowed memory size of 134217728 bytes exhausted (tried to allocate 79743562 bytes) in Z:\home\textcleaner.ru\www\index.php on line 61

    79743562 это размер файла который надо почистить.
    Как это исправить??
     
  6. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    Все прекрасно лезет.
     
  7. Ganad

    Ganad Пользователь

    Сообщения:
    3.253
    Симпатии:
    0
    Потому что много мусора или изза того что не тематический? Текстовку можно ведь и очистить. Или еще есть какие либо причины на нелюбовь пс к такой текстовке?
     
  8. antoha487

    antoha487 Пользователь

    Сообщения:
    793
    Симпатии:
    0
    Сделай размер файла меньше
     
  9. west-lost

    west-lost Пользователь

    Сообщения:
    37
    Симпатии:
    0
    В RBT 2.0 как называются эти алгоритмы ?
     
  10. Ganad

    Ganad Пользователь

    Сообщения:
    3.253
    Симпатии:
    0
    А почему скан долго жить не будет? обычная ведь текстовка
     
  11. kirhost

    kirhost Пользователь

    Сообщения:
    738
    Симпатии:
    0
    Скан в яше уже ни как не катит, с первым аппом его выкидывает и рубает еще нормальные страницы. Даже гс уже со сканом не делают. Понту нет)
     
  12. rementese

    rementese Guest

    Сначала пытался почистить файл 100 мб, потом 70мб, 30 мб.
    В общем скрипт начал работать при размере файла 5 мб в чем может быть проблема??
     
  13. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    Да нафига париться?
     
  14. maxmaster

    maxmaster Пользователь

    Сообщения:
    1.429
    Симпатии:
    0
    Случайные предложения - в настройках - Алгоритм генерации текста - рандомные строчки.
     
  15. Vasiaka

    Vasiaka Пользователь

    Сообщения:
    14.478
    Симпатии:
    0
    Там не случайные предложения, а стыковка по запятым.
     
  16. Ganad

    Ganad Пользователь

    Сообщения:
    3.253
    Симпатии:
    0
    А чем скан будет отличаться от текстовки из книжек, или из книжек тоже не очень?
     
  17. kirhost

    kirhost Пользователь

    Сообщения:
    738
    Симпатии:
    0
    Можно попробовать. Но смысла я думаю нет. Вылетать все будет, и не только те что не по тематике но и тематические.
     
  18. kratur

    kratur Пользователь

    Сообщения:
    2.894
    Симпатии:
    0
    ну набор слов, без смысла. тематики ноль. грамматических ошибок куча наверняка. дофига непонятных псам слов от слэнгов.
    просто никчему этот геморой. если эксперимент маленький - лучше тематическую взять текстовку.
    если доров много - то тут проблематично тематическую собирать, проще книжки расчленить и прочистить
     
  19. kirhost

    kirhost Пользователь

    Сообщения:
    738
    Симпатии:
    0
    Скан это те же текстовики с книг.
     
  20. Ganad

    Ganad Пользователь

    Сообщения:
    3.253
    Симпатии:
    0
    У меня вопросик насчет текстовки. Я подключен к локалке, там у нас есть форум(на движке joomala), естественно в индексе пс его нету. Собственно вопрос, чем можно напарсить текстовку из него. И стоит ли оно того?
    PS Есть еще irc чат, там тож постоянно много всякой херни пишут, можно ли оттуда текстовку парсить? По идее текстовка же должна быть уникальной или нет?
     
Черновик сохранён Черновик удалён
Загрузка...