tengu_crow: (Default)
[personal profile] tengu_crow
Заинтересовался настольными поисковиками. Теми, что дают доступ к текстовой информации, хранящейся в файлах. Потестировал дома Copernic, dtSearch и иже с ними и... остался в жестоком разочаровании.

Маленькое пояснение - программы, о которых я говорю очень похожи на интернетовские поисковики. Занимаются они вот чем - берут все указанные им файлы и составляют по ним индекс-содержание, которое показывает где и какое слово хранится. А когда я задаю запрос на поиск - они вместо того, чтобы пересканировать файлы, просто смотрят по индексу.

Я, наивный, надеялся составить такой индекс для своей дисковой базы (а дисков у меня уже есть довольно много и если бы не каталогер - я имел бы все шансы захлебнуться в потоке информации)...

Ага щаз. Получилось что даже у самой продвинутого поисковика размер индекса составляет не менее 1/5 от индексируемого пространства. У менее продвинутых - примерно 1/2 места, занимаемого индексируемыми файлами. То есть индекс на 120Г диск составит примерно 60Гиг (и нафига мне такое счастье?). При том, что по тексту ищут далеко не все. При том, что пространство в несчастных два десятка Гиг они сканируют по полдня. При том, что далеко не все работают со сменными носителями памяти. Copernic, например вообще занимается черти-чем, вместо индексирования нужной информации (он конечно проиндексировал все .mp3-тэги, но ни до .apc, ни до нежно любимого мной .ogg так и не добрался. не говоря о том, что не проиндексировал мои текстовые файлы).

В общем - ботва. Сплошное разочарование. TC (особенно в тандеме с Cathy или похожим каталогером) оставляет их всех далеко за флагом. Получается, что до сих пор лучший поисковый инструмент - правильно составленное имя файла и хорошо поставленная система сбора данных. Что открыли еще древние римляне - Nomen sunt omen. "Имя есть предзнаменование" или "Имя есть содержимое", если переводить по смыслу.
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

April 2026

S M T W T F S
   1234
5678910 11
12131415161718
19202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 7th, 2026 08:40 am
Powered by Dreamwidth Studios