V B A :
W o r d
и
E x c e l®
в
помощ
ь литературоведу
В предыдущих номерах ж урнала
“Компьютер ”
м ы рассматривали разнообразие версий язы ка
программирования Бейсик и некоторые воз-
можност и макросов в пакет е M icrosoft
.
Сейчас м ы продолжим изучать возможности
автоматизации в этом наборе программ,
и
превратим электронную таблицу Excel в ин-
струмент для анализа текста.
В
состав Word уже входит простейший инстру-
мент для анализа текста, который открыва-
ется командой меню
Сервис > Статистика.
..
( р и с .
1 ) .
При его выборе открывается маленькое
окошко с информа-
цией о количестве
символов, слов, аб-
зацев и страниц в
тексте. Эта функция
- любимый инстру-
мент журналистов,
пишущих статьи в
те издания, где оп-
лата зависит от ко-
личества символов
в публикации.
Более подробный анализ текста можно провес-
ти,
если
написать
соответствующий
макрос
на
языке
V i s u a l B a s i c f o r A p p l i c a t i o n s .
В разрабаты-
ваемой
программе
с
помощью
VBA
могут
сочетаться
возмож-
ности Word по обработке текстов
и
мощные статистические функ-
ции, встроенные в Excel.
Разведём статистику
И
так, вооружившись компью-
тером,
мы
сможем
решать
одну из важных задач в литерату-
роведении - определение автор-
ства
текстов,
то
есть
выбирать
наиболее вероятного автора про-
изведения,
анализируя
его текст
и сравнивая с текстами, об авторе
которых уже известно.
Для
достижения
цели
мы
вос-
пользуемся,
наверное,
простей-
шим, но, по заверению его разра-
ботчиков, вполне действенным ме-
тодом
-
вычислением
авторского
инварианта.
Авторский инвариант
- это некоторая ве-
личина,
характеризующая
текст,
которая
примерно
одинаковая в разных произведениях одного писателя,
но сильно отличается в текстах разных авторов.
В предложенном методе инвариантом является
отношение количества служебных слов (предло-
гов, союзов и частиц) к общему количеству слов в
тексте. Более подробно с методикой и её резуль-
татами можно ознакомиться по адресу
http://lib.ru/FOMENKOAT/greece.txt,
в Приложении 1.
Рис. 2. В качестве интерфейса нашей программы
-
рабочая книга MS Excel
Puc.l. Простейший инструмент
для анализа текста в Word-e
.
предыдущая страница 52 Компьютер 2010 11-12 читать онлайн следующая страница 54 Компьютер 2010 11-12 читать онлайн Домой Выключить/включить текст