Re[2]: баг, в смысле моль... :)))
От: Erop Россия  
Дата: 28.11.08 21:27
Оценка: 2 (1)
Здравствуйте, morpher, Вы писали:

M>Алгоритм склонения лучший среди аналогов.



Не знаю, насколько он "лучший среди аналогов", но вот фразу "ночная моль" прикольно склоняет...

Введите слово или словосочетание в именительном падеже: коварная моль Род, число: женский род, единственное число кто, что? коварная моль кого, чего? коварной моль кому, чему? коварной моль кого, что? коварную моль кем, чем? коварной моль о ком, о чём? о коварной моль



А ещё с "АвтоВАЗ" прикольно выходит...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[2]: Склонение слов русского языка
От: andy1618 Россия  
Дата: 30.11.08 14:25
Оценка:
Здравствуйте, morpher, Вы писали:

...
M>Алгоритм склонения лучший среди аналогов.

Недавнюю багу
Автор: andy1618
Дата: 22.11.08
поправили, молодцы.
Но есть ещё, над чем поработать — сравните вывод алгоритма десятилетней давности
на основе словаря Зализняка, например, для слова "чай":
http://starling.rinet.ru/cgi-bin/morph.cgi?flags=wndnnnn&root=config&word=���

и вывод вашего алгоритма:
=
Род, число: мужской род, единственное число
кто, что? чай
кого, чего? чая
кому, чему? чаю
кого, что? чай
кем, чем? чаем
о ком, о чём? о чае
=

То, что нет производных словоформ — это ладно, но даже для выводимого набора:
нет второго родительного падежа, нет второго предложного падежа, нет ударений.
Если составлять текст договора — то, конечно, прокатит, но для серьёзных приложений (морф. анализ,
орфокоррекция, распознавание родственных слов, распознавание и синтез речи, ...) — увы.
Re[3]: Склонение слов русского языка
От: morpher Великобритания http://morpher.ru
Дата: 02.12.08 13:52
Оценка:
Здравствуйте, Erop, Вы писали:

E> А как их сравнивают? Я думал, что они уже давно умеют работать абсолютно точно...


Увы, до абсолютной точности алгоритмам склонения ещё далеко. Отчасти этому способствует богатство русского языка на всякие неоднозначности и нерегулярности, формально учесть которые не хватит и целой жизни. Однако сделать алгоритм, учитывающий большинство практических случаев вполне возможно, к чему я и стремлюсь.

Сравнить алгоритмы достаточно просто — путём скармливания им одного и того же списка входных данных и сравнения полученных результатов. Если результаты различны, то по крайней мере один из них неправильный. Есть вероятность, что оба алгоритма ошибутся в каком-то случае одинаково. Такие ошибки можно отловить только сравнением с заранее подготовленным результатом, если он есть.

Чтобы не быть голословным, в ближайшее время я собираюсь провести и опубликовать такое сравнение своего алгоритма с аналогичными. Среди аналогов наиболее достойным считаю разработку Плахова и Покаташкина. Если у кого-то есть желание поучаствовать в этом эксперименте, присылайте ссылки на ваши библиотеки и сервисы склонения с указаниями, как с ними можно провзаимодействовать из C#.

Проведение такого сравнения затрудняет также различие в функциональности сравниваемых алгоритмов. Так, Padeg.dll (Плахов и Покаташкин) требует для ФИО указания пола либо отчества, что значительно сужает набор тестовых данных. Мой алгоритм (morpher.ru) не требует ни пола, ни отчества, а наоборот выдаёт автоматически определённый род. Поэтому придётся разбивать тестовые данные на группы — полные ФИО, неполные ФИО с полом, профессии, наименования организаций, номенклатура материалов / изделий, географические названия и т.д. — и тестировать каждую пару алгоритмов отдельно на каждой группе. Такого "всеядного" алгоритма как morpher.ru, насколько я знаю, в природе не существует.

Итак, ждите результатов эксперимента.

С уважением, Сергей
Re[3]: Склонение слов русского языка
От: morpher Великобритания http://morpher.ru
Дата: 02.12.08 14:05
Оценка:
Здравствуйте, andy1618, Вы писали:

A> То, что нет производных словоформ — это ладно, но даже для выводимого набора:

A> нет второго родительного падежа, нет второго предложного падежа, нет ударений.
A> Если составлять текст договора — то, конечно, прокатит, но для серьёзных приложений (морф. анализ,
A> орфокоррекция, распознавание родственных слов, распознавание и синтез речи, ...) — увы.

На самой первой странице http://morpher.ru написано, что модуль предназначен для склонения слов и словосочетаний на русском языке. Ни для чего другого он не предназначен. Второй предложный планирую в перспективе добавить, вместе с выбором предлога — может пригодиться для топонимов: на площади — в сквере, в комнате — на кухне, в России — на Украине.
Re[3]: баг, в смысле моль... :)))
От: Аноним  
Дата: 02.12.08 14:35
Оценка: :))
Здравствуйте, Erop, Вы писали:

E>

Введите слово или словосочетание в именительном падеже: коварная моль Род, число: женский род, единственное число кто, что? коварная моль кого, чего? коварной моль кому, чему? коварной моль кого, что? коварную моль кем, чем? коварной моль о ком, о чём? о коварной моль



Да, залетела одна моль в код автоматического разрешения омографии. Поправил, теперь всё в порядке, спасибо!
Re[4]: Склонение слов русского языка
От: Erop Россия  
Дата: 02.12.08 16:37
Оценка:
Здравствуйте, morpher, Вы писали:


M>Увы, до абсолютной точности алгоритмам склонения ещё далеко. Отчасти этому способствует богатство русского языка на всякие неоднозначности и нерегулярности, формально учесть которые не хватит и целой жизни. Однако сделать алгоритм, учитывающий большинство практических случаев вполне возможно, к чему я и стремлюсь.


Казалось бы, списко русских фамилий, географических названий имён и отчеств -- множество закрытое. Слов тоже...
AFAIK, существуют морфологические энжины, которые работают на основании словарной информации, так что работают абсолютно точно, за исключением случаев омонимии (скажем если из исходных данных не ясен пол склоняемого лица)

M>Чтобы не быть голословным, в ближайшее время я собираюсь провести и опубликовать такое сравнение своего алгоритма с аналогичными. Среди аналогов наиболее достойным считаю разработку Плахова и Покаташкина. Если у кого-то есть желание поучаствовать в этом эксперименте, присылайте ссылки на ваши библиотеки и сервисы склонения с указаниями, как с ними можно провзаимодействовать из C#.


Так ты таки утверждаешь, что морфер -- это "Алгоритм склонения лучший среди аналогов", или ты ещё только собираешься проводить тестирование?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[4]: баг, в смысле моль... :)))
От: Erop Россия  
Дата: 02.12.08 16:37
Оценка:
Здравствуйте, Аноним, Вы писали:

А>Да, залетела одна моль в код автоматического разрешения омографии. Поправил, теперь всё в порядке, спасибо!


1) Для "спасибо" тут есть кнопки
2) Если бы одна...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[4]: Теперь с авторитетами не дружим...
От: Erop Россия  
Дата: 02.12.08 16:43
Оценка: 1 (1)
Здравствуйте, Аноним, Вы писали:

А>Да, залетела одна моль в код автоматического разрешения омографии. Поправил, теперь всё в порядке, спасибо!



Угу, чтобы не быть голословным про "если бы одна"...
Теперь мы Женю Меченного как-то нехорошо склоняем. Женя он такой, могёт и вставить паяльник или ещё чего ещё куда...

Введите слово или словосочетание в именительном падеже: Женя Меченый Род, число: женский род, единственное число кто, что? Женя Меченый кого, чего? Жени Меченый кому, чему? Жене Меченый кого, что? Женю Меченый кем, чем? Женей Меченый о ком, о чём? о Жене Меченый

Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[5]: Склонение слов русского языка
От: morpher Великобритания http://morpher.ru
Дата: 03.12.08 09:08
Оценка:
Здравствуйте, Erop, Вы писали:

E> Казалось бы, списко русских фамилий, географических названий имён и отчеств -- множество закрытое. Слов тоже...


Неверное предположение. Состав имён и фамилий, как и нарицательных постоянно пополняется за счёт заимствований и новообразований. Даже количество слов на какой-то конкретный момент не поддаётся точной оценке, т.к. учесть все научные термины, названия химических веществ и препаратов, профессиональный сленг, диалектизмы и т.д. можно лишь весьма приблизительно. Любой словарь отстаёт от жизни в лучшем случае на пару лет.

Кроме того, проблема неоднозначности склонения отдельных слов — это ничто по сравнению с неоднозначностями, возникающими при анализе словосочетаний.

Любовь Петрова — любовь Петрова
Иван Козлов — Стадо Козлов
... и многие другие.

Придуманний тобой пример "моль вещества" выходит далеко за рамки грамматики, и Склонятель с ним не справляется. Так что работать есть над чем, я тебя уверяю.


E> Так ты таки утверждаешь, что морфер -- это "Алгоритм склонения лучший среди аналогов", или ты ещё только собираешься проводить тестирование?


Утверждаю на основании предварительного тестирования. Ждите результатов.
Re[5]: Теперь с авторитетами не дружим...
От: morpher Великобритания http://morpher.ru
Дата: 03.12.08 22:28
Оценка:
Здравствуйте, Erop, Вы писали:

E>Теперь мы Женю Меченного как-то нехорошо склоняем. Женя он такой, могёт и вставить паяльник или ещё чего ещё куда...


С Женей мы договорились. Одним испорченным паяльником будет меньше.
Re[6]: А теперь с КМЛ нехорошо обходитесь...
От: Erop Россия  
Дата: 04.12.08 00:02
Оценка: 1 (1)
Здравствуйте, morpher, Вы писали:

M>С Женей мы договорились. Одним испорченным паяльником будет меньше.


Ну а теперь можете и с комнатой Ленина что-то сделать.
А то нехорошо как-то выходит, слегка по-чувашски...

Введите слово или словосочетание в именительном падеже:
комната Ленина

Род, число: женский род, единственное число
кто, что? комната Ленина
кого, чего? комнаты Ленины
кому, чему? комнате Ленине
кого, что? комнату Ленину
кем, чем? комнатой Лениной
о ком, о чём? о комнате Ленине

Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[3]: баг, в смысле моль... :)))
От: ettcat США  
Дата: 04.12.08 08:04
Оценка: 1 (1)
Erop wrote:
> Здравствуйте, morpher, Вы писали:
>
> M>Алгоритм склонения лучший среди аналогов.

> Не знаю, насколько он "лучший среди аналогов", но вот фразу "ночная моль" прикольно склоняет...

> [c] Введите слово или словосочетание в именительном падеже:
> коварная моль
>
> Род, число: женский род, единственное число
> А ещё с "АвтоВАЗ" прикольно выходит...
А вот и аналоги:

http://nano.yandex.ru/project/inflect/

Кто? — ночная моль
Кого? — ночной моли (родительный падеж)
Кому? — ночной моли
Кого? — ночную моль (винительный падеж)
Кем? — ночной молем
О ком? — о ночной моле

Кто? — АвтоВАЗ
Кого? — АвтоВАЗа (родительный падеж)
Кому? — АвтоВАЗу
Кого? — АвтоВАЗ (винительный падеж)
Кем? — АвтоВАЗом
О ком? — об АвтоВАЗе

Кто? — Женя Меченый
Кого? — Жени Меченого (родительный падеж)
Кому? — Жене Меченому
Кого? — Женю Меченый (винительный падеж)
Кем? — Женей Меченым
О ком? — о Жене Меченом

А вот с комнатой Ленина засада:
Кто? — комната Ленина
Кого? — комнаты Ленины (родительный падеж)
Кому? — комнате Ленине
Кого? — комнату Ленину (винительный падеж)
Кем? — комнатой Лениной
О ком? — о комнате Ленине
Posted via RSDN NNTP Server 2.1 beta
Re[7]: А теперь с КМЛ нехорошо обходитесь...
От: morpher Великобритания http://morpher.ru
Дата: 04.12.08 09:19
Оценка: :)
Здравствуйте, Erop, Вы писали:

E>Ну а теперь можете и с комнатой Ленина что-то сделать.


Сделаю, но позже. Пример очень специфичный, т.к. форма "Ленина" совпадает с женским именем Ленина (с ударением на И). Пока есть более важные задачи.
Re: Склонение слов русского языка
От: Аноним  
Дата: 04.12.08 09:25
Оценка:
Здравствуйте, flashpoint, Вы писали:

F>Кто-нить делал склонение слов руского языка ????

F>Например: Иванов Иван Иванович->Иванову Ивану Ивановичу->Ивановым Иваном Ивановичем и т.д.
F>Т.е. алгоритм принимает слово в 1-ом параметре, а во 2-м параметре мы указываем склонение.

F>CMyClass a1;

F>CString csWord = "Иванов";
F>CString csRes = a1.GetWord(csWord,"РП"); // родительный падеж

http://aot.ru/download.php
Re[4]: баг, в смысле моль... :)))
От: morpher Великобритания http://morpher.ru
Дата: 04.12.08 09:39
Оценка:
Здравствуйте, ettcat, Вы писали:

E> А вот и аналоги:


E>http://nano.yandex.ru/project/inflect/


E>Кто? — ночная моль

E>Кого? — ночной моли (родительный падеж)
E>Кому? — ночной моли
E>Кого? — ночную моль (винительный падеж)
E>Кем? — ночной молем
E>О ком? — о ночной моле

Это насколько изощрённым должен быть алгоритм, чтобы на один и тот же вопрос (Кого?) дать два разных ответа?

E>Кто? — АвтоВАЗ

E>Кого? — АвтоВАЗа (родительный падеж)
E>Кому? — АвтоВАЗу
E>Кого? — АвтоВАЗ (винительный падеж)
E>Кем? — АвтоВАЗом
E>О ком? — об АвтоВАЗе

АвтоВАЗ — аббревиатура и в официальных документах не склоняется:
http://stcreserv.narod.ru/Uchebnik/morfologia.html (ищите на странице "АвтоВАЗ")
Хотя в интернете повсюду склоняют. Ладно, засчитаем как правильный.

E>Кто? — Женя Меченый

E>Кого? — Жени Меченого (родительный падеж)
E>Кому? — Жене Меченому
E>Кого? — Женю Меченый (винительный падеж)
E>Кем? — Женей Меченым
E>О ком? — о Жене Меченом

Ошибка в винительном.

E>А вот с комнатой Ленина засада:

E>Кто? — комната Ленина
E>Кого? — комнаты Ленины (родительный падеж)
E>Кому? — комнате Ленине
E>Кого? — комнату Ленину (винительный падеж)
E>Кем? — комнатой Лениной
E>О ком? — о комнате Ленине

Итого правильных ответов: morpher — 2/4, яндекс — 1/4.
Re[8]: А теперь с КМЛ нехорошо обходитесь...
От: Erop Россия  
Дата: 04.12.08 11:23
Оценка:
Здравствуйте, morpher, Вы писали:

M>Сделаю, но позже. Пример очень специфичный, т.к. форма "Ленина" совпадает с женским именем Ленина (с ударением на И). Пока есть более важные задачи.


Ну дык тогда была бы "команата Ленины" вроде? А если "Комната" -- это фамилия, то она была бы с большой буквы... А про омонимию я догадываюсь...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[5]: баг, в смысле моль... :)))
От: Erop Россия  
Дата: 04.12.08 11:26
Оценка: 2 (2)
Здравствуйте, morpher, Вы писали:

E>>Кого? — ночной моли (родительный падеж)

E>>Кого? — ночную моль (винительный падеж)
M>Это насколько изощрённым должен быть алгоритм, чтобы на один и тот же вопрос (Кого?) дать два разных ответа?

А и тем не менее это верно.
Нет ночной моли, но убить ночную моль...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[6]: баг, в смысле моль... :)))
От: morpher Великобритания http://morpher.ru
Дата: 04.12.08 16:25
Оценка:
Здравствуйте, Erop, Вы писали:

E>Нет ночной моли, но убить ночную моль...


Ты прав, я погорячился. Мой сервис склоняет так же. Но на результаты сравнения яндекс — морфер это не влияет.
Re[9]: А теперь с КМЛ нехорошо обходитесь...
От: morpher Великобритания http://morpher.ru
Дата: 04.12.08 16:37
Оценка:
Здравствуйте, Erop, Вы писали:

E> А если "Комната" -- это фамилия, то она была бы с большой буквы...


Увы, пользователи интернета обычно весьма пренебрежительно относятся к регистру букв. Поэтому пришлось научить этому и склонятель. А в DLL есть возможность указать, ФИО это или нет. Если указать "нет", то Ленин будет спать спокойно...
Re[5]: баг, в смысле моль... :)))
От: Cyberax Марс  
Дата: 04.12.08 17:06
Оценка: +1 -1
Здравствуйте, morpher, Вы писали:

M>Это насколько изощрённым должен быть алгоритм, чтобы на один и тот же вопрос (Кого?) дать два разных ответа?

Называется количественно-определительный падеж (он же "второй родительный", он же "партитив"): "килограмм сахару".
Как вариант — местный падеж (он же "второй предложный", он же "локатив"): "стоять в снегу", "держать на весу".
Sapienti sat!
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.