| Автоматическая привязка текстовой адресной информации к клас | |
| От: | Корниенко С. А. | ||
| Дата: | 15.03.08 12:34 | ||
| Оценка: | 220 (10) | ||
| Статья: Автоматическая привязка текстовой адресной информации к классификатору КЛАДР Автор(ы): Корниенко С. А. Дата: 15.03.2008 Статья разбирает частный пример актуальной задачи сравнения нечетко введенной информации с жестко заданным образцом. Авторы: Корниенко С. А. Аннотация: Статья разбирает частный пример актуальной задачи сравнения нечетко введенной информации с жестко заданным образцом. |
| Re: Автоматическая привязка текстовой адресной информации к | |
| От: | AlexMAS | ||
| Дата: | 20.06.08 05:17 |
| Здравствуйте. Спасибо за статью, довольно интересный алгоритм. Дело в том, что у меня аналогичная задача, только справочник другой (не КЛАДР). В нем слово «проспект» пишется полностью, например: "Ленина проспект", "Победы проспект" и т.д. Таким образом, если пользователь вводит "пр. Ленина", то алгоритм выдает не проспект, а улицу "Ленина", т.к. слова "пр" и "проспект" являются не созвучными:
Как вы сравнивали soundex's – жестко (то есть по полному совпадению) или допускали некоторую погрешность (если да, то как это делали)?
Я не знаю, насколько это правильно и допустимо ли такое, как думаете? Если перефразировать — допустимо ли говорить о созвучии слов, если их soundex-коды отличаются на малую величину (например, 4%)? Пока я решил проблему так: сокращения "пр" заменяю на "проспект", а потом запускаю алгоритм. Спасибо. С уважением, Александр Межов |
| Re: Автоматическая привязка текстовой адресной информации к | |
| От: | dwarwood | ||
| Дата: | 04.07.08 07:14 |
| Здравствуйте, Корниенко С. А., Вы писали: КСА>Аннотация: КСА>Статья разбирает частный пример актуальной задачи сравнения нечетко введенной информации с жестко заданным образцом. спасибо, интересно. надо будет поразбираться. |
| Re: Автоматическая привязка текстовой адресной информации к | |
| От: | bhatta | ||
| Дата: | 24.01.09 16:02 | ||
| Оценка: | -1 | ||
| Здравствуйте, Корниенко С. А., Вы писали: КСА>Статья: www.post-address.ru совершенно другой алгоритм который позволяет искать и разбирать и сопостовлять. Это больше поисковая часть, но на ее основе сделана система которая разбирает не менее 95% из в принципе возможных к идентификации адресов. После его допиливания готов поделиться с общественностью. КСА>Автоматическая привязка текстовой адресной информации к классификатору КЛАДР Автор(ы): Корниенко С. А. Дата: 15.03.2008 Статья разбирает частный пример актуальной задачи сравнения нечетко введенной информации с жестко заданным образцом. КСА>Авторы: КСА> Корниенко С. А. КСА>Аннотация: КСА>Статья разбирает частный пример актуальной задачи сравнения нечетко введенной информации с жестко заданным образцом. |
| Re: Автоматическая привязка текстовой адресной информации к | |
| От: | Marty | ||
| Дата: | 25.01.09 21:41 |
| Здравствуйте, Корниенко С. А., Вы писали: Решал аналогичную задачу — база с оригинальной номенклатурой, и прайсы поставщиков в разных форматах с произвольно набранными наименованиями, не привязанные к базе. вообщем, примерно также и решал — приводим к одному регистру, убираем всевозможные символы, кроме алфавитно-цифровых, заменяя их пробелами, короткие слова 1-2-3 символа подставляем из пополняемого словаря, если нет в словаре, выбрасываем (выброшенное кладем в лог для последующего анализа), разбиваем наименование по словам и сортируем, склеиваем опять и ищем в базе. В базе, соответственно, над всеми позициями проведена подобная нормализация. Работало неплохо. Если кому интересно, могу посмотреть детали. |