Вы здесьПоиск книг по DC++ хабам
Опубликовано ср, 01/04/2009 - 16:16 пользователем Bill_G
вот нашел интересный ресурс: http://dc-poisk.no-ip.org Цитата: запущен сервер поиска магнет ссылок http://dc-poisk.no-ip.org:17000. Его задача показать: как легко организовать поиск книг и журналов в хабах. Теперь любой энтузиаст без написания строчки кода может создать базу данных из миллионов ссылок на документы.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
sem14 RE:Серия "Символы времени" издательства "Аграф" 2 дня
sem14 RE:Собираем серию: "Азбука-триллер", издательство "Азбука-Терра" 2 дня sem14 RE:«Юмористическая серия» 2 дня Океана RE:Подайте бедному копеечку на книжку с литреса... 4 дня larin RE:Оплатил. Абонемент не отображается 5 дней larin RE:Оплатил, но абонемент не отображается 1 неделя nehug@cheaphub.net RE:DNS 2 недели alexk RE:Багрепорт - 2 2 недели sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 недели Isais RE:Семейственность в литературе 3 недели Violontan RE:Жан Батист Мольер воскрешенный 3 недели sem14 RE:Гонкуровская премия 1 месяц Dead_Space RE:Беженцы с Флибусты 1 месяц Саша из Киева RE:Приключения белочки Рыжки 1 месяц alex-from RE:Оплатил два раза, но абонемента нет 1 месяц Kiesza RE:На 78-м году жизни скончался советский и российский... 1 месяц Paul von Sokolovski RE:Бушков умер. 1 месяц lemma7 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 1 месяц Впечатления о книгах
trampak про Кот: Основа русского мира [litres] (Исторические приключения, Публицистика)
21 12 Русские сначала называют что-то русским, чтобы потом это сделать своим. Я.Гашек Оценка: нечитаемо
nambus про Гор: Шаровая молния 3 (Попаданцы, Самиздат, сетевая литература)
21 12 «Незалежная» — это разговорное, часто с оттенком иронии или пренебрежения, название для Украины, происходящее от украинского слова «незалежна», что означает «независимая». В более широком смысле, «незалежный» — это синоним ………
Олег Макаров. про Муха: Товарищ мэр (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
20 12 Сначала не понял, почему "Альтернативная история" а потом ка-ак понял: 2025 год, Россия в которой закон, справедливость и неподкупная журналистика побеждают алчность, беззаконие и коррупцию. А самизнаетечего и в помине нету. Оценка: хорошо
Никос Костакис про Гор: Шаровая молния 3 (Попаданцы, Самиздат, сетевая литература)
20 12 «напитались» реалиями Незалёжной первых лет XXI века. __________________ Незалёжной? Такого слова в украинском языке нет. В русском тоже. Тогда по-каковски это, а?
alexk про Кош: Лакомство для вампира [СИ] (Городское фэнтези, Мистика, Самиздат, сетевая литература)
20 12 ..ать! Ну на хрена портить все ссылки? Удали ты их вообще, если они тебе мешают. Что за гомосятина?
Sello про Гече: Библейские истории (Критика, Религия)
20 12 Такие книги бессиысленно комментировать. Автор, кстати, занят не столько тем, что "раскрывает несостоятельность представлений о "богодухновенности" библейских сказаний, сколько, анализом, поисками точек соприкосновения историчности ………
Олег Макаров. про Прягин: Даль-цвет. Том 1. Охра (Фэнтези, Попаданцы, Самиздат, сетевая литература)
19 12 Давно не было у меня такого, чтобы дочитать том и «а-а-а! теперь же неизвестно сколько ждать следующего!!!» Отлично. С огромным удовольствием от первой до последней страницы. Оценка: отлично!
Олег Макаров. про Денисов: Извлекатели. Группа «Сибирь» [СИ] (Боевая фантастика, Самиздат, сетевая литература)
19 12 Совершенно долбанутая вещь: люди из “прекрасной России настоящего” в параллельном мире - России, где "Путин не пришёл ко власти и всё разваливается, страну разворовывают либералы”... Оценка: нечитаемо
Дей про Хлеб наемника
18 12 В общем, первые две книги это один ГГ, а остальные - совсем другой, хоть и тот же Артакс. В остальных он уже ленивый, потолстевший, забросивший тренировки. Периодически о нём кто-то вспоминает и выдаёт квест. Автор частенько ………
Никос Костакис про Гор: Шаровая молния [СИ] (Попаданцы, Самиздат, сетевая литература)
17 12 Как там у еще не родившегося Ивасюка? Повсюду буйно квитна черемшина..." ______________________ Ага. "Почему я не сокол?" (с) |
Комментарии
Отв: Поиск книг по DC++ хабам
Идея отличная, но хорошо бы ещё список хабов. Или это специальная уловка, чтобы копирасты задолбались искать? :)
Отв: Поиск книг по DC++ хабам
Десяток хабов и жалкие 14 тысяч проиндексированных пользователей?
Это смешно.
Отв: Поиск книг по DC++ хабам
Rogue
Трудно сказать,
вопрос скорее к автору,
впрочем список книжных хабов я уже давал,
Hutt
вопрос скорее всего упирается в железо,
попробуйте у себя дома поднять такую базу.
и никакие они не жалкие, там на несколько Петабайт инфы.
Отв: Поиск книг по DC++ хабам
Извиняюсь за оффтоп, но после поисков в сети я не нашёл решения вопроса, возникающего при нажатии на магнет ссылку. Жму, открывается окно клиента (мюторрент), и больше ничего не происходит, а ведь, как я понял, должна открыться закачка, которая начнётся, как только подойдёт раздающий. Если кто может - подскажите, что сделать.
Отв: Поиск книг по DC++ хабам
тут вроде нужен особый клиент ДЦ++ а Торренты не подходят.
Отв: Поиск книг по DC++ хабам
О, спасибо, и впрямь клиент отдельный нужен.
Отв: Поиск книг по DC++ хабам
Я когда-то пользовался StrongDC клиентом. неплохая весчь
Отв: Поиск книг по DC++ хабам
Пока это разумная достаточность. Если книга есть в электронном виде, то с высокой долей вероятности вы ее найдете в этом поисковике. Т.к. индексировались хабы РФ, то вероятность для русскоязычной литературы выше. Почему только 14000? Т.к. канал доступа в инет 512Кбит, много файл-листов для последующей индексации скачать не получается.
В новости есть ошибочка :
http://dc-poisk.no-ip.org:17000 поисковик на основе Яндекс-сервера
http://dc-poisk.no-ip.org поисковик на основе Сфинкса
Т.е. два разных поисковика. http://dc-poisk.no-ip.org проиндексировал 247 863 661 имя файла, в http://dc-poisk.no-ip.org:17000 только около 8 000 000 и все. Для http://dc-poisk.no-ip.org:17000 думаю уйти от поиска всего и заточить только под книги, добавив туда возможность поиска по нескольким страницам с начала и конца книги. Загвоздка только в вычислительных мощностях, на моей машине нужно несколько месяцев непрерывной работы, т.к большинство книг не содержат текстового слоя и его надо создавать с помощью OCR. В принципе сейчас это может сделать любой, кто имеет большую коллекцию книг. Для этого используйте SSearch, Яндекс Сервер, FindISBN. После того как получите текстовые слои, надо дописать маленькую программку в несколько экранов кода, которая сканирует файловое дерево с книгами, вычисляет их TTH, находит, где хранится HTML файл описатель, который создан SSearch (его имя «TTH_книги-размер_файла.HTML») и дописывает туда текстовый слой, полученный FindISBN. Все! индексируйте эти «TTH_книги-размер_файла.HTML» яндек сервером и получаете что-то типа http://books.google.ru/ .
Найти где сейчас "тусуется" юзер, расшаривший нужный файл можно здесь: http://www.publichublist.nl/ или http://www.dchublist.com/ . Т.е. вы найдете имя хаба к которому подключён юзер в данный момент.