tengu_crow (
tengu_crow) wrote2009-01-08 01:04 pm
![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Entry tags:
Аффигительно Большой Текстовый Файл - 2
По просьбе сэра ollycat продолжаю зарисовки по поводу Аффигительно Большого Текстового файла.
Дисклеймер: то, что эта система удобна для меня не значит, что она удобна еще для кого-нибудь. Я бы рассматривал это не столько как целостную схему, сколько, как комплект удобных инструментов, которые могут быть так или иначе использованы для ведения заметок.
Дисклеймер2: у меня уже сложилась терминология и такой большой файл с заметками я часто называю "блогом". В принципе, по большому счету, это и есть блог. Но оффлайновый :)
Главный файл разбит так:
Схема сложилась из общих соображений - открывая файл всегда удобно видеть содержание и список БыстрыхСлов-закладок, а добавлять заметки удобнее всего с конца - тем более что любой редактор позволяет быстро прыгнуть в конец файла.
Верхнюю половину занимает структурированная часть. Там хранится все, что поддается структурированию: рецепты, телефоны, адреса, линки, мысли, конспекты, словарик с новыми для меня словами - всякими там "лацпортами", "вьетминями", "трабекулами" и "хуацяо", тренировочные программы, подсказки, читшиты и заметки по софту, виммерингу и питонству и прочее и прочее.
Есть простенький скрипт на Питоне, который "выкусывает" из общего блога свежие адреса-транспорт-задачи-конспекты. Все это богатство парсится с помощью makeztxt (он понимает мою структуру разделов и автоматом добавляет закладки на все заголовки) в .pdb-файл и заливается в палм. Самое приятное, что все это повешено на один ярлык и мне, чтобы залить в палм свежую версию нужно сделать только один двойной клик.
В самом верху располагается содержание - список основных разделов Структуры и БыстрыеСлова. Содержание генерится автоматически, с помощью небольшого скрипта на Питоне, а БыстрыеСлова
Идею БыстрыхСлов я утащил из wiki-систем. Я использую их как закладки для быстрых прыжков на нужные мне разделы. Очень удобно поставить в нужном разделе метку типа "СписокМоихПроектов", а потом продублировать это слово в содержании.
Это упрощает навигацию в любом редакторе - можно либо выделить БыстроеСлово или название раздела в Содержании и нажать Ctrl+F и вставив его в окно поиска прыгнуть к нужному месту в файле. Умные текстовые редакторы типа AkelPad определяют сами - выделен какой-то текст или нет и по нажатию Ctrl+F сами вставляют его в окно поиска. В Vim все реализовано очень просто - нужно встать курсором на слово и нажать "*" - и сразу прыгаешь к следующему вхождению такого слова.
В содержании я пользуюсь аналогичной системой - когда НазванияРазделов пишутся слитно через большие буквы (квази-венгерская нотация :) - это позволяет здорово ускорить поиск по файлу и не путает разделы с прочими словами.
Нижнюю половину занимает Дневник. Он сам выглядит как один из разделов Структуры, но устроен хитрее. Дневник - это последовательность моих заметок, начинающихся с таймстампов.
Дневник одновременно работает как Место Хаоса - все что нужно срочно зафиксировать, внезапно пришедшие в голову или свалившиеся откуда-то извне идеи, линки, зацепки - все что некогда или неохота сортировать попадает в Дневник. Потом, при желании можно будет это перенести в нужные места и рассортировать. И даже без сортировки оно все равно не потеряется - поиск по тексту работает всегда и в любом редакторе.
Также в Дневник попадают те заметки, которые я делаю в палме или надиктовываю на диктофон - они тоже датируются, поэтому их очень легко и удобно вставлять в блог.
Таймстампы, разделяющие записи выполняют сразу несколько функций. Они отделяют одну запись от другой (очень удобно писать короткими мыслями, разделяя их таймстампами времени - 13:01, 14:03 и так далее) и попутно связывают записи в одну ленту-поток в которой все идет последовательно и все события связаны друг с другом.
Тамстамп для дневниковой записи обычно выглядит так:

«20090108 blog example3»
Видно, что кроме таймстампа в строке может присутствовать тэг. Тэгом считается все, что заключено в "крылышки". Эти тэги подсвечиваются желтым цветом. Таймстампы - синим. Мне удобно помечать таким макаром пробежки (например, при желании можно с помощью grep'а создать список дней, когда я бегал и развернуть его в график, но чаще я просто смотрю сколько и когда я бегал и на основании этого планирую следующие пробежки). Кроме того ими удобно помечать разнообразные идеи и фичи:
=фича=
если нет времени сортировать поступающий поток инфы - кинуть в дневник, а позже - распределить туда, куда нужно
==
=фича=
Идея по точкам сбора. Точнее - точкам входа. В больших проектах такой точкой может служить блог. Т.е. просто в блоге по ходу дела писать - чем занимался и чем намерен заниматься дальше.
==
Система тэгов еще в стадии разработки - мне хочется как-нибудь сделать так, чтобы их можно было добавлять автоматом, выбирая из списка, как это делается со снипетами программного кода. И когда-нибудь, когда у меня дойдут руки я этим займусь. Пока проставляю тэги вручную.
Таймстампы проставляются автоматом. Подробности будут в следующей серии :)
Дисклеймер: то, что эта система удобна для меня не значит, что она удобна еще для кого-нибудь. Я бы рассматривал это не столько как целостную схему, сколько, как комплект удобных инструментов, которые могут быть так или иначе использованы для ведения заметок.
Дисклеймер2: у меня уже сложилась терминология и такой большой файл с заметками я часто называю "блогом". В принципе, по большому счету, это и есть блог. Но оффлайновый :)
Главный файл разбит так:
Схема сложилась из общих соображений - открывая файл всегда удобно видеть содержание и список БыстрыхСлов-закладок, а добавлять заметки удобнее всего с конца - тем более что любой редактор позволяет быстро прыгнуть в конец файла.
Верхнюю половину занимает структурированная часть. Там хранится все, что поддается структурированию: рецепты, телефоны, адреса, линки, мысли, конспекты, словарик с новыми для меня словами - всякими там "лацпортами", "вьетминями", "трабекулами" и "хуацяо", тренировочные программы, подсказки, читшиты и заметки по софту, виммерингу и питонству и прочее и прочее.
Есть простенький скрипт на Питоне, который "выкусывает" из общего блога свежие адреса-транспорт-задачи-конспекты. Все это богатство парсится с помощью makeztxt (он понимает мою структуру разделов и автоматом добавляет закладки на все заголовки) в .pdb-файл и заливается в палм. Самое приятное, что все это повешено на один ярлык и мне, чтобы залить в палм свежую версию нужно сделать только один двойной клик.
В самом верху располагается содержание - список основных разделов Структуры и БыстрыеСлова. Содержание генерится автоматически, с помощью небольшого скрипта на Питоне, а БыстрыеСлова
Идею БыстрыхСлов я утащил из wiki-систем. Я использую их как закладки для быстрых прыжков на нужные мне разделы. Очень удобно поставить в нужном разделе метку типа "СписокМоихПроектов", а потом продублировать это слово в содержании.
Это упрощает навигацию в любом редакторе - можно либо выделить БыстроеСлово или название раздела в Содержании и нажать Ctrl+F и вставив его в окно поиска прыгнуть к нужному месту в файле. Умные текстовые редакторы типа AkelPad определяют сами - выделен какой-то текст или нет и по нажатию Ctrl+F сами вставляют его в окно поиска. В Vim все реализовано очень просто - нужно встать курсором на слово и нажать "*" - и сразу прыгаешь к следующему вхождению такого слова.
В содержании я пользуюсь аналогичной системой - когда НазванияРазделов пишутся слитно через большие буквы (квази-венгерская нотация :) - это позволяет здорово ускорить поиск по файлу и не путает разделы с прочими словами.
Нижнюю половину занимает Дневник. Он сам выглядит как один из разделов Структуры, но устроен хитрее. Дневник - это последовательность моих заметок, начинающихся с таймстампов.
Дневник одновременно работает как Место Хаоса - все что нужно срочно зафиксировать, внезапно пришедшие в голову или свалившиеся откуда-то извне идеи, линки, зацепки - все что некогда или неохота сортировать попадает в Дневник. Потом, при желании можно будет это перенести в нужные места и рассортировать. И даже без сортировки оно все равно не потеряется - поиск по тексту работает всегда и в любом редакторе.
Также в Дневник попадают те заметки, которые я делаю в палме или надиктовываю на диктофон - они тоже датируются, поэтому их очень легко и удобно вставлять в блог.
Таймстампы, разделяющие записи выполняют сразу несколько функций. Они отделяют одну запись от другой (очень удобно писать короткими мыслями, разделяя их таймстампами времени - 13:01, 14:03 и так далее) и попутно связывают записи в одну ленту-поток в которой все идет последовательно и все события связаны друг с другом.
Тамстамп для дневниковой записи обычно выглядит так:

«20090108 blog example3»
Видно, что кроме таймстампа в строке может присутствовать тэг. Тэгом считается все, что заключено в "крылышки". Эти тэги подсвечиваются желтым цветом. Таймстампы - синим. Мне удобно помечать таким макаром пробежки (например, при желании можно с помощью grep'а создать список дней, когда я бегал и развернуть его в график, но чаще я просто смотрю сколько и когда я бегал и на основании этого планирую следующие пробежки). Кроме того ими удобно помечать разнообразные идеи и фичи:
=фича=
если нет времени сортировать поступающий поток инфы - кинуть в дневник, а позже - распределить туда, куда нужно
==
=фича=
Идея по точкам сбора. Точнее - точкам входа. В больших проектах такой точкой может служить блог. Т.е. просто в блоге по ходу дела писать - чем занимался и чем намерен заниматься дальше.
==
Система тэгов еще в стадии разработки - мне хочется как-нибудь сделать так, чтобы их можно было добавлять автоматом, выбирая из списка, как это делается со снипетами программного кода. И когда-нибудь, когда у меня дойдут руки я этим займусь. Пока проставляю тэги вручную.
Таймстампы проставляются автоматом. Подробности будут в следующей серии :)
no subject
no subject
no subject
no subject
no subject
ты когда-нить слышал про прогу по имени lateX ? что-то вроде текстового редактора
no subject
no subject
Это не текстовый редактор :) Это немного интереснее. Говоря очень грубо - это текстовый файл с особой разметкой в тексте (ну... как html), который скармливается особому софту и на выходе получается красивый pdf или gs - файл. Прелесть в том, что такой текстовой разметкой можно задать очень многое - есть расширения для нот и шахмат, например.
no subject
на обычные текстовые редакторы похож очень отдаленно, текст в нем, скорее, программируется :)
но результат забавный и повозиться тоже есть с чем, пока не расковыряешь (вставка рисунков например)
но с хорошим руководством не так страшен черт
no subject
no subject
Пока писал этот пост - сомневался стоит ли рассказывать так подробно, но мне кажется, что тогда будет понятно зачем скрипты и прочее :)
no subject
задумался...
no subject
но есть лопата - записи нужно разбирать и расшифровывать...
ну и
http://www.improvement.ru/zametki/osdict/
no subject
no subject
ЗЫ Оффтоповый вопрос. Если я задерживаюсь с комментами их появление можно отслеживать по OpenID? Т.е. в ЖЖ есть сервис, когда уведомление о новых комментах высылается почтой... а клиента OpenID ставит в известность о таком? :)
no subject
no subject
А если попробовать wiki?
Идея простая, единственный html-файл в котором можно изменять, удалять
Есть метки, оглавление, wiki-разметка. Наполнение при помощи браузера. Все очень просто
Re: А если попробовать wiki?
- на большом количестве записей оно заметно тормозит
- ява скрипт работает далеко не везде и не везде работает одинаково
- сложности с экспортом - там где я просто скриптом выкусываю нужный кусок текста и кидаю его себе в палм (по почте, в мобильник - все, что подскажет мне фантазия) - с Викисистемами фих его знает что делать
- резервирование, хранение истории изменений и синхронизация - у меня под это заточен subversion, который хорошо работает как раз с текстом и уже пару раз меня выручал
- несвободность форматирования всего и вся. в тексте я волен выбирать то, что нравится мне, в вики-системах я все-таки скован
примерно так. Но идея сама по себе имеет право на сущестование :))) Инструмент хороший и вообще.
Re: А если попробовать wiki?
Классная, на мой взгляд, wiki - Zim Desktop Wiki. Минус - хранит записи не в единственном файле.
tengu_crow, может, глянете. В Ubuntu ставится из стандартного репозитория.
Хотел Вас спросить. Файл огромный, как долго сохраняется по Save?
Я обратил внимание для NoteCase, если файл большой и стоит автосохранение каждые 30 секунд, то сохранение настолько медленно, что если оно в момент ввода текста с клавиатуры, то успеваешь пропустить несколько букв.
Re: А если попробовать wiki?
зачем? у меня хорошо работает Vim и я до этого момента им более чем доволен :) причины по которым у меня не приживаются wiki-системы - я уже описывал.
>Файл огромный, как долго сохраняется по Save?
С NoteCase я дела не имел - ничего определенного сказать не могу. Vim быстр даже на очень больших файлах.
Re: А если попробовать wiki?
Если содержание большое и иерархичное, есть ли возможность свернуть заголовки разделов второго уровня, оставить видимыми заголовки только первого, основные разделы?
Как? Фолдинг?
В Tree-Like органайзерах можно разворачивать нужные и сворачивать ненужные узлы дерева иерархии для удобства работы. Меняя таким образом видимое подмножество разделов.
Есть ли что-нибудь подобное у вас для работы с ОБф?
Как Вы решаете все возрастающую сложность все время развернутого оглавления?
Спасибо!
no subject
no subject
no subject
no subject
no subject
http://www.gentoo.org/doc/ru/vi-guide.xml
Чудный такой мануал - я как увидел - понял - Vim - это мое :)))
Ну и для комплекта:
http://fantaseour.livejournal.com/43907.html
no subject
no subject
Мне не нравится за большой вес, изобилие неинтуитивных клавиш - в общем после vim я туда не хочу :)
Синхронизация из нескольких источников
Интересная идея, давно ищу.
Есть и у меня соображения. Если интересно, напишу.
У меня основной вопрос: допустим, у вас несколько компьютеров: на работе, дома, нетбук или КПК для поездок. Как синхронизировать записи в них всех, как иметь идентичный файл на всех компьютерах?
(Посредством флешки и/или FTP, хотя кое-где может не быть инета)
Можно это как-то несложно и австоматически осуществить?
Re: Синхронизация из нескольких источников
Общая схема такая:
1. Организовать сервер. Залить на него исходные файлы.
2. Запросить сервер о рабочей копии - получить ее. Поскольку рабочих копий может быть сколько угодно - одну можно запросить на флэшку, одну на диск и т.д.
3. В любой рабочей копии можно работать. Чтобы сохранить изменения файлов в репозитарий - отдать команду - svn commit - и посмотреть как система сольет свежие версии файлов на сервер. Чтобы получить обновленные файлы - svn update.
Если содержание большое и иерархичное
Если содержание большое и иерархичное, есть ли возможность свернуть заголовки разделов второго уровня, оставить видимыми заголовки только первого, основные разделы?
Как? Фолдинг?
В Tree-Like органайзерах можно разворачивать нужные и сворачивать ненужные узлы дерева иерархии для удобства работы. Меняя таким образом видимое подмножество разделов.
Есть ли что-нибудь подобное у вас для работы с ОБф?
Как Вы решаете все возрастающую сложность все время развернутого оглавления?
И каким скриптом формируете оглавление и экспортируете в freemind?
Спасибо!
Re: Если содержание большое и иерархичное
Да. Фолдинг. В тексте я приводил ссылки на статьи где это подробно и с примерами описано.
Про сложность тоже писал.
Про скрипты - еще раз - они еще не выкладывались - как только приведу в порядок - выложу.
no subject
Появился вопросик: можно ли как то реализавать отображение популярности всех тегов АБТФ основыаясь на их количестве, непосредственно внутри самого vim-а?
no subject
Теги в АБТФ (tengu_crow: Аффигительно Большой Текстовый Фай
Inbox.msf 9 Мб
Inbox 159 Мб
Оба текстовые, Inbox.msf, думаю, индекс, содержит:
//
< <(a=c)> // (f=iso-8859-1)
(B8=onlineSize)(80=ns:msg:db:row:scope:msgs:all)(81=subject)(82=sender)
(83=message-id)(84=references)(85=recipients)(86=date)(87=size)
...
<(12769=923de07)(12768=4a84102d)(80=1)>
[2400:m(^9C^12769)(^8F^12769)(^91^12768)(^92=1)(^93=1)]
...
Прекрасно все индексируется, поиск быстрый.
Что, если теги и др. вспомогательную информацию хранить в отдельном индексном файле?
Не облегчит ли это обработку?
Re: Теги в АБТФ (tengu_crow: Аффигительно Большой Текстовый Ф
Но теги - штука такая... я еще не пришел ни к чему толковому в этом направлении. Мысли есть, но для толковой реализации пока не хватает времени. Если вкратце - система должна обеспечивать не просто выдачу набора статей по одному тегу, а поиск методом решета - задаются несколько тегов и выдаются на-гора те статьи, которые помечены именно этим набором тегов.
Re: Теги в АБТФ (tengu_crow: Аффигительно Большой Текстовый Ф
Re: Теги в АБТФ (tengu_crow: Аффигительно Большой Текстовый Ф
Чисто технически это скорее всего просто получится. По хоткею вызывается скрипт на Питоне, который получает на вход имя файла и тег. Скрипт генерит текст, который сбрасывается во временный файл (по желанию где-нибудь в заголовок можно кидать названия тегов етс). Из этого файла можно снова вызывать этот скрипт и так далее.