tengu_crow: (Default)
[personal profile] tengu_crow
Заинтересовался настольными поисковиками. Теми, что дают доступ к текстовой информации, хранящейся в файлах. Потестировал дома Copernic, dtSearch и иже с ними и... остался в жестоком разочаровании.

Маленькое пояснение - программы, о которых я говорю очень похожи на интернетовские поисковики. Занимаются они вот чем - берут все указанные им файлы и составляют по ним индекс-содержание, которое показывает где и какое слово хранится. А когда я задаю запрос на поиск - они вместо того, чтобы пересканировать файлы, просто смотрят по индексу.

Я, наивный, надеялся составить такой индекс для своей дисковой базы (а дисков у меня уже есть довольно много и если бы не каталогер - я имел бы все шансы захлебнуться в потоке информации)...

Ага щаз. Получилось что даже у самой продвинутого поисковика размер индекса составляет не менее 1/5 от индексируемого пространства. У менее продвинутых - примерно 1/2 места, занимаемого индексируемыми файлами. То есть индекс на 120Г диск составит примерно 60Гиг (и нафига мне такое счастье?). При том, что по тексту ищут далеко не все. При том, что пространство в несчастных два десятка Гиг они сканируют по полдня. При том, что далеко не все работают со сменными носителями памяти. Copernic, например вообще занимается черти-чем, вместо индексирования нужной информации (он конечно проиндексировал все .mp3-тэги, но ни до .apc, ни до нежно любимого мной .ogg так и не добрался. не говоря о том, что не проиндексировал мои текстовые файлы).

В общем - ботва. Сплошное разочарование. TC (особенно в тандеме с Cathy или похожим каталогером) оставляет их всех далеко за флагом. Получается, что до сих пор лучший поисковый инструмент - правильно составленное имя файла и хорошо поставленная система сбора данных. Что открыли еще древние римляне - Nomen sunt omen. "Имя есть предзнаменование" или "Имя есть содержимое", если переводить по смыслу.

April 2026

S M T W T F S
   1234
5678910 11
12131415161718
19202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 6th, 2026 09:28 am
Powered by Dreamwidth Studios