Обсуждение участника:Евгения Кан
Добавить темуДобро пожаловать в Викиверситет!
[править]
Здравствуйте, и добро пожаловать в русскоязычную часть Викиверситета! Надеемся, Вы получите большое удовольствие от участия в проекте.
Постарайтесь вначале статьи обозначить цель Вашей работы. Укажите, является ли создаваемая Вами страница учебным курсом или исследовательской работой.
Если Вы хотите написать энциклопедическую статью, то для этого есть Википедия, см. Чем не является Викиверситет.
Ознакомьтесь, пожалуйста, с вики-разметкой и принципами размещения и именования статей.
Чтобы получать актуальную информацию о событиях, происходящих в Викиверситете, Вы можете установить шаблон {{Актуально}}, например, в самое начало своей страницы обсуждения.
Иллюстрации загружайте на Викисклад, предназначенный для хранения медиафайлов вики-проектов. Прочитайте, пожалуйста, брошюру об основах иллюстрирования статей в Википедии и работе на Викискладе. Загруженные файлы на Викисклад можно будет одинаково легко использовать в Википедии и в Викиверситете.
По всем вопросам смело обращайтесь на портал сообщества или к одному из администраторов.
При этом, пожалуйста, подписывайтесь на страницах обсуждения (но не в статьях Викиверситета), используя четыре идущих подряд знака тильды (~~~~). И ещё раз — добро пожаловать! :-) вы можете убрать данный шаблон с вашей страницы обсуждения по собственному желанию
-- New user message (обсуждение) 16:06, 24 декабря 2015 (UTC)
Автоматическая Обработка Текста
[править]Модуль "Морфология" базируется на грамматическом словаре А.А.Зализняка[1987]. При лемматизации для каждого слова входного текста выдается множество морфологических интерпретаций следующего вида: лемма (всегда пишется большими буквами); морфологическая часть речи; набор общих граммем (которые относятся ко всем словоформам парадигмы слова, множество наборов граммем.Так, при вводе слова "мама" мы получаем категорию одушевлённости, род, число, падеж. Если выбрать дополнительную функцию "With paradigms", можно увидеть и парадигматический ряд данного слова. Модуль "Синтаксис" позволяет ввести предложение и увидеть его синтаксический разбор по фрагментам, группам и типам членов предложений в схематическом наглядном виде. Модуль "Граф" позволяет выстроить поверхностный семантический граф предложения с точки зрения логических категорий. Модуль "Поиск по массиву" осуществляет поиск по библиотеке Мошкова (версия 2006 года, 844 млн. токенов и позволяет увидеть весь массив предложений, в которых употребляется введённое нами слово ("мама"). Их в данном случае 75700 в русских, зарубежных и переводных изданиях. Модуль "Поиск по биграммам" показывает употребление данного слова в контексте, например, по объёму взаимной информации. В такой системе текст является источником накопления знаний системы. Образуется единый аппарат понимания текстов, который позволяет минимизировать интеллектуальные и временные затраты, даёт возможность извлечь интересующую информацию из текстов различного содержания. Евгения Кан (обсуждение) 17:04, 24 декабря 2015 (UTC)
Работа морфологического анализатора
[править]Морфологический анализатор С.А.Старостина является он-лайновой версией программы морфологического анализа слов русского/английского языков. Позволяет получить для вводимого слова базовую форму и морфологическую информацию. Программа реализована на основе словарей Зализняка (рус.яз.) и Мюллера (англ.яз.). Затраты времени минимальны, что может пригодиться филологу (и не только) в написании научных работ. Вот примеры анализа некоторых слов. Слово "мама":
Исходная форма: мама Словарная информация: жо 1а
Перевод: ma; mamma I;mummy II
Морфологическая характеристика: Ns
Ед. число Множ. число Именительный ма'ма ма'мы Родительный ма'мы ма'м Дательный ма'ме ма'мам Винительный одуш. ма'му ма'м Творительный ма'мой, ма'мою ма'мами Предложный ма'ме ма'мах
Слово "пельмени": 1. Исходная форма: пельмени Словарная информация: мн. от м 2а
Морфологическая характеристика: Np ,Api
2. Исходная форма: пельмень
Словарная информация: м 2а
Морфологическая характеристика: Np ,Api
1 вариант:
Ед. число Множ. число
Именительный пельме'ни
Родительный пельме'ней
Дательный пельме'ням
Винительный неод. пельме'ни
Творительный пельме'нями
Предложный пельме'нях
2 вариант:
Ед. число Множ. число
Именительный пельме'нь пельме'ни
Родительный пельме'ня пельме'ней
Дательный пельме'ню пельме'ням
Винительный неод. пельме'нь пельме'ни
Творительный пельме'нем пельме'нями
Предложный пельме'не пельме'нях
Слово "дерево": Исходная форма: дерево Словарная информация: с 1а @ мн. дере'в ья, -ьев, -ьям
Перевод: arbor I;arboreal; arboriculture; bo-tree; bowery I;bread-fruit; fruiter; tree; wood;
Морфологическая характеристика: Ns ,Asi
Ед. число Множ. число Именительный де'рево дере'вья Родительный де'рева дере'вьев Дательный де'реву дере'вьям Винительный неод. де'рево дере'вья Творительный де'ревом дере'вьями Предложный де'реве дере'вьях
Слово "мост":
Исходная форма: мост Словарная информация: м, 1в//1с, п2(на) % по' мосту//по мо'сту//по мосту'; за' мост//за мо'ст; на' мост//на мо'ст; под мосто'м//под мо'стом//по'д мостом; за мочто'м//за мо'стом//за' мостом
Перевод: balance-bridge; bridge I;deck-bridge; drawbridge; flying; bridge; pontoon I;span II;transpontine;
Морфологическая характеристика: Ns ,Asi
Ед. число Множ. число
Именительный мо'ст мосты'
Родительный моста' мосто'в
Дательный мосту' моста'м
Винительный неод. мо'ст мосты'
Творительный мосто'м моста'ми
Предложный мосте' моста'х
Предложный 2 мосту'
Слово "озеро": Исходная форма: озеро Словарная информация: с 1а @ мн. озе"р а, -, -ам
Перевод: flood; lake I;loch; lough; mere I
Морфологическая характеристика: Ns ,Asi
Ед. число Множ. число Именительный о'зеро озе"ра Родительный о'зера озе"р Дательный о'зеру озе"рам Винительный неод. о'зеро озе"ра Творительный о'зером озе"рами Предложный о'зере озе"рах
Слово "star": star [sta:] 1. n 1) звезда'; свети'ло; fixed ?s неподви'жные зве"зды
2) звезда', веду'щий акте"р или актри'са; выдаю'щаяся ли'чность; literary ? изве'стный писа'тель; soccer ? знамени'тый футболи'ст
3) полигр. зве"здочка
4) что-л., напомина'ющее звезду'; зве"здочка (белая отметина на лбу животного)
5) судьба', рок; to have one's ? in the ascendant преуспева'ть; to thank (или to bless) one's ?s благодари'ть судьбу' ?s and stripes госуда'рственный флаг США; I saw ?s = у меня' и'скры посы'пались из глаз
star [sta:] 2. a
1) зве"здный
2) выдаю'щийся; великоле'пный; веду'щий; ? witness гла'вный свиде'тель
3): ? system театр. тру'ппа с одни'м, двумя' первокла'ссными акте"рами и сла'бым анса'мблем
star [sta:] 3. v
1) украша'ть зве"здами
2) отмеча'ть зве"здочкой
3) игра'ть гла'вные ро'ли, быть звездо'й; to ? in the provinces гастроли'ровать в прови'нции в гла'вных роля'х
4) предоставля'ть гла'вную роль
Слово "book"^ book [buk] 1. n 1) кни'га, литерату'рное произведе'ние
2) (the B.) би'блия
3) том, кни'га, часть
4) либре'тто; текст (оперы и т. п.); сцена'рий
5) конто'рская кни'га
6) сбо'рник отче"тов (коммерческого предприятия, научного общества и т. п.; тж. ?s)
7) букме'керская кни'га за'писи ста'вок пари' (на скачках); за'пись заключа'емых пари'
8) кни'жечка (билетов на автобус и т. п.); a ? of matches кни'жечка карто'нных спи'чек
9): a ? of stamps а) альбо'м ма'рок; б) кни'жечка почто'вых марок
10) карт. (пе'рвые) шесть взя'ток одно'й из сторо'н (в висте)
11) attr. кни'жный; ? learning кни'жные (или теорети'ческие) зна'ния to read smb. like a ? прекра'сно понима'ть кого'-л., ви'деть наскво'зь; to speak by the ? говори'ть (о че"м-л.) на основа'нии то'чной информа'ции; to be on the ?s зна'читься в спи'ске; to be in smb.'s good (bad, black) ?s быть у кого'-л. на хоро'шем (плохо'м) счету'; one for the ? досто'йный серье"зного внима'ния, значи'тельный; to bring to ? призва'ть к отве'ту; to know a thing like a ? = знать что-л. как свои' пять па'льцев; without ? по па'мяти; to suit smb.'s ? совпада'ть с чьи'ми-л. пла'нами, Сотвеча'ть чьим-л. интере'сам
book [buk] 2. v
1) заноси'ть в кни'гу, (за)регистри'ровать
2) зака'зывать, брать биле'т (железнодорожный и т. п.)
3) принима'ть зака'зы на биле'ты; all the seats are ?ed (up) все места' про'даны
4) заручи'ться согла'сием; приглаша'ть; ангажи'ровать (акте"ра, оратора); I shall ? you for Friday evening жду вас в пя'тницу ве'чером I'm ?ed я попа'лся
Слово "fish": fish I [fi«] 1. n 1) (pl часто без измен.) ры'ба; распр. тж. кра'бы, у'стрицы; ? and chips ры'ба с жа'реной карто'шкой
2) пренебр. тип; cool ? наха'л, нагле'ц; odd (или queer) ? чуда'к; poor ? никуды'шный челове'к
3) (the F. или Fishes) Ры'бы (созвездие и знак зодиака)
4) амер. разг. до'ллар
5) attr. ры'бный; ? corral садо'к для ры'бы all's ? that comes to his net посл. = до'брому во'ру все" впо'ру; он ниче'м не бре'згует; to feed the ?es разг. а) утону'ть; б) страда'ть морско'й боле'знью; to have other ? to fry име'ть други'е дела'; to make ? of one and flesh of another относи'ться к лю'дям неро'вно, пристра'стно; a pretty kettle of ?! разг. = весе"ленькая исто'рия!; хоро'шенькое де'ло!; ? story = "охо'тничий расска'з"; преувеличе'ние, небыли'цы; neither ?, flesh nor fowl (или good red herring) ни ры'ба ни мя'со; ни то' ни се"
fish [fi«] I 2. v
1) лови'ть или уди'ть ры'бу
2): to ? the anchor мор. поднима'ть я'корь ? for а) иска'ть в воде' (жемчуг и т. п.); б) разг. выу'живать (секреты); в) разг. напра'шиваться, набива'ться; to ? for compliments (for an invitation) напра'шиваться на комплиме'нты (на приглаше'ние); ? out разг. а) достава'ть; выта'скивать (из кармана); б) выу'живать, выпы'тывать (секреты); ? up выта'скивать (из воды) to ? or cut bait амер. сде'лать вы'бор, не откла'дывая в до'лгий я'щик
fish II [fi«] 1. n
1) мор. фиш (в якорном устройстве); шка'ло (у мачты)
2) = fish-plate
fish [fi«] II 2. v тех. соединя'ть накла'дкой; скрепля'ть сты'ком
fish III [fi«] n фи'шка
Слово "perfect":
perfect 1. a ['pЌ:fikt] 1) соверше'нный, идеа'льный, безупре'чный; безукори'зненный
2) зако'нченный, це'льный
3) то'чный; абсолю'тный, по'лный; ? fifth муз. чи'стая кви'нта; ? square то'чный квадра'т; a ? stranger совсе'м чужо'й челове'к; in ? sincerity вполне' открове'нно, с по'лной открове'нностью; ? competition эк. свобо'дная конкуре'нция
4) настоя'щий, и'стинный
5) хорошо' подгото'вленный; дости'гший соверше'нства
6) грам. перфе'ктный
perfect 2. n ['pЌ:fikt] грам. перфе'кт
perfect 3. v [pЌ'fekt]
1) соверше'нствовать; улучша'ть
2) заверша'ть, зака'нчивать, выполня'ть
Слово "cool":
cool [ku:l] 1. a 1) прохла'дный, све'жий; нежа'ркий; to get ? стать прохла'дным; осты'ть
2) споко'йный, невозмути'мый; хладнокро'вный; to keep ? (one's head) сохраня'ть споко'йствие, хладнокро'вие; не теря'ть го'лову
3) равноду'шный, безуча'стный; сухо'й, нела'сковый, неприве'тливый
4) де'рзкий, беззасте'нчивый, наха'льный; a ? hand (или customer) беззасте'нчивый челове'к; ? cheek наха'льство
5) разг. кру'глый (о сумме); a ? thousand dollars кру'гленькая су'мма в ты'сячу до'лларов; a ? twenty kilometres до'брых два'дцать киломе'тров
cool [ku:l] 2. n
1) прохла'да
2) хладнокро'вие
cool [ku:l] 3. v охлажда'ть(ся); остыва'ть (часто ? down, ? off) Евгения Кан (обсуждение) 17:21, 24 декабря 2015 (UTC)
ЛингвоАнализатор
[править]Данная программа позволяет определить близостиь любого из предлагаемых пользователем Интернета текста к одному из авторских эталонов, определенных заранее. С помощью ЛингвоАнализатора, не читая текст, пользователь можете оценить его сходство с произведениями писателей. Используется математическая модель определения авторства, учитывающая формальные характеристики языка того или иного писателя. Лингвоанализатор в ходе работы выводит результаты в виде фрагмента текста и в зависимости от типа выдачи результата - научный либо литературный комментарий. Мы выбрали для анализа фрагмент из фантастической повести М. Булгакова "Роковые яйца". ЛингвоАнализатор выдал нам следующий результат: Уважаемый пользователь!
Вообще-то, приведенный фрагмент сравнительно мал, и имеется немного оснований для того, чтобы судить о его существенной близости к одному из 134 авторских эталонов. Ниже приведена тройка ближайших авторских эталонов, возможно, не содержащая истинного автора. Интегральные характеристики предложенного текста, в принципе, равноудалены от всех авторских эталонов. Однако, среди всей совокупности авторских эталонов один автор, разумеется, оказывается в используемой метрике ближе всех остальных, и именно на этом основании можно утверждать, что автор данного текста, пишет как писатель Михаил Булгаков. Последнее справедливо со сравнительно небольшой вероятностью 30%. Текст, если он действительно был создан этим писателем, похож на следующие его произведения:
30% Михаил Булгаков Роковые яйца Собачье сердце Мастер и Маргарита
В сложившейся ситуации необходимо упомянуть также двух авторов, чьи эталоны следующие по близости к данному тексту: соавторы Аркадий Стругацкий и Григорий Гребнев или писатель Александр Шалимов. Несмотря на то, что они оказались на втором и третьем местах, они также могли бы оказаться авторами предложенного текста. Но в пользу каждого из них можно дать разве 9% и 4%, соответственно. Трудно утверждать что-либо определенное, но текст в некоторой степени похож на следующие произведения этих писателей: (на приведенные ниже произведения он похож больше, чем на остальные произведения данных писателей, хотя, говоря строго, он скорее непохож на них, чем похож)
9% в соавторстве Аркадий Стругацкий и Григорий Гребнев Мир иной 4% Александр Шалимов Стена Кто нажмет "стоп-кран"? Бомба замедленного действия
Несмотря на сравнительно небольшую длину Вашего фрагмента, результат анализа мог оказаться вполне корректным. Сообщите, пожалуйста, об этом, заполнив приведенную ниже форму. Если авторство определено неверно, все равно сообщите об этом. Надеюсь, что для Вас эти комментарии окажутся полезными. Лично мне было интересно ознакомиться с этим текстом. Искренне Ваш, ЛингвоАнализатор Институт лингвистических исследований АН СССР по адресу ул.Банная, д.17, 3 этаж, направо, через актовый зал, малоприметная дверь в углу зала с надписью: "Писатели - сюда."
Итак, авторство и название произведения определено верно, хотя фрагмент был действительно небольшой. Кроме того, в программе есть возможность сделать научный анализ нашего фрагмента. Вот его результат.
В первом столбце находится энтропия данного текста относительно матрицы коэффициентов автора. 2.508833 | Михаил Булгаков 2.515711 | Аркадий Стругацкий, Григорий Гребнев 2.517485 | Александр Шалимов
Михаил Булгаков В первом столбце --- энтропия данного текста относительно матрицы коэффициентов произведения
2.493471 Роковые яйца 2.506491 Собачье сердце 2.515883 Мастер и Маргарита
Аркадий Стругацкий, Григорий Гребнев В первом столбце --- энтропия данного текста относительно матрицы коэффициентов произведения
2.515711 Мир иной
Александр Шалимов В первом столбце --- энтропия данного текста относительно матрицы коэффициентов произведения
2.504607 Стена 2.508667 Кто нажмет "стоп-кран"? 2.509827 Бомба замедленного действия Евгения Кан (обсуждение) 17:43, 24 декабря 2015 (UTC)
Он-лайновый лингвистический процессор Атрибутор 1.01
[править]Программа-атрибутор представляет собой лингвистический процессор для автоматического сравнения и классификации текстов по параметрам индивидуального авторского стиля. Программы обрабатывает присылаемый пользователем текст неизвестного происхождения с целью распознания автора или определения списка наиболее близких к нему по стилистике авторов из числа переченя "эталонных" авторов. Вот какой результат нашей работы с данной программой. Анализ фрагмента из романа М. Горького "Мать" выдал следующее: Этот текст, по-видимому, не содержит индивидуальных стилистических черт. Список наиболее близких авторов (в порядке убывания вероятности): А.Фадеев, Б.Васильев. Таким образом, авторство было определено неверно. А вот фрагменту из романа "Дубровский" А.С. Пушкина больше повезло. Результат анализа: Скорее всего, этот текст принадлежит А.С.Пушкину. Спасибо, что хоть Александра Сергеевича признали. :)
Евгения Кан (обсуждение) 17:52, 24 декабря 2015 (UTC)