авторефераты диссертаций БЕСПЛАТНАЯ  БИБЛИОТЕКА

АВТОРЕФЕРАТЫ КАНДИДАТСКИХ, ДОКТОРСКИХ ДИССЕРТАЦИЙ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:   || 2 |
-- [ Страница 1 ] --

Игорь Моисеевич Зацман,

кандидат технических наук,

зав. Отделом информационных технологий

структуризации и поиска данных ИПИ РАН

iz_ipi@a170.ipi.ac.ru

ПОСТРОЕНИЕ СИСТЕМЫ ТЕРМИНОВ

ИНФОРМАЦИОННО-КОМПЬЮТЕРНОЙ НАУКИ:

ПРОБЛЕМНО-ОРИЕНТИРОВАННЫЙ ПОДХОД Доклад на 6-м заседании семинара «Методологические проблемы наук об информации»

(Москва, ИНИОН РАН, 19 апреля 2012 г.) Аннотация Рассматривается проблема интеграции информационной науки (information science) и компьютерной науки (computer science). Интерес к этой проблеме возник около 50 лет назад, и ей была посвящена серия статей американского ученого Сола Горна (Saul Gorn, 1912-1992), опубликованных в период 1963-1983 гг. (41;

43;

38;

42;

39;

40). В наше время актуальность интеграции информационной и компьютерных наук существенно возросла.

Об этом свидетельствуют приоритетные направления исследований и разработок по информационно-коммуникационным технологиям (ИКТ) 7-й Рамочной программы Европейского Союза (ЕС), принятой на период 2007 2013 гг. (34;

33;

44;

45;

46;

36), а также включение в конкурс 2011 г. РФФИ по ориентированным фундаментальным исследованиям проблематики конвергентных технологий, существенная часть которых относится к информационной, компьютерной и когнитивным наукам.

Приоритетные направления разработки новых поколений ИКТ и конвергентных технологий представлены как внешние факторы интеграции информационной и компьютерной наук. Помимо внешних факторов, в докладе рассматриваются исторические предпосылки их интеграции.

Согласно подходу А. Соломоника перечисляются четыре составляющих научной парадигмы информационно-компьютерной науки как единой фундаментальной дисциплины. Предлагается система терминов этой дисциплины. Приведенный в докладе процесс построения системы терминов не претендует на завершенность.

Содержание Введение 1. Приоритетные направления исследований по ИКТ и конвергентным технологиям 1.1. О конвергентных технологиях в конкурсе РФФИ 2011 г. по ориентированным фундаментальным исследованиям 1.2. Тематическая программа по ИКТ 7-й Рамочной программы ЕС 2. Четыре составляющих парадигмы отрасли знаний (фундаментальной дисциплины) 3. Построение системы терминов информационно-компьютерной науки как составляющей ее научной парадигмы 3.1. Ключевые слова описания предметной области информационно компьютерной науки 3.2. Сопоставление значений терминов Заключение Литература Введение В апреле 2013 г. исполнится 50 лет с того момента, как была опубликована статья американского ученого Сола Горна (Saul Gorn, 1912 1992) «Информационно-компьютерные науки как новая фундаментальная область знаний» (41). В течение 20 лет в 1963-1983 гг. Горн опубликовал серию статей, в которых обосновывал необходимость преподавания дисциплин, относящихся к новой области знаний, интегрирующей информационную и компьютерную науки, а также предпринял попытку описать ее задачи и предметную область. В 1963 г. Горн использовал множественное число в названии этой дисциплины (науки). Единственное число появилось в 1982 г. в названии его статьи «Информатика как информационно-компьютерная наука: ее идеология, методология и социальные аспекты», т.е. через 20 лет после публикации первой работы из этой серии (39).

Почти 50 лет назад результат интеграции информационной и компьютерной наук понимался Горном именно как фундаментальная наука, что нашло отражение в самом названии его работы – «a new basic discipline»

(41). В качестве смежных дисциплин Горн называет библиотековедение, теорию информационного поиска, информационную науку, кибернетику, когнитивную психологию, искусственный интеллект, семиотику, лингвистику и математику (40, с. 121).

Уже в 1963 г. Горн перечислил вопросы, которые относятся к информационно-компьютерной науке: «Примерами основных вопросов исследования в этой области могут быть системы программирования, проектирование компьютерных систем, искусственный интеллект, информационный поиск и т.д. Вероятностная информационная теория Шеннона определенно принадлежит к этой области знания, но помимо нее существует еще теория информации искусственных языков и ее обработки, которую также необходимо включить в предметную область этой науки.

Одним из центральных вопросов этой новой дисциплины, скорее всего, станет синтез и анализ искусственных языков и их процессоров» (41, с. 150).

Горн в явном виде включает в перечень направлений, изучаемых информационно-компьютерной наукой, искусственный интеллект, информационный поиск, синтез и анализ искусственных языков. После перечисления этих направлений, информационно-компьютерная наука рассматривается им как учебная дисциплина и далее говорится о необходимости описать способы различения новой области знаний от соседних с ней областей в учебном процессе. К примеру, каким образом абитуриент может узнать, относится ли сфера его интересов именно к этой новой области знаний, а не к одной из уже устоявшихся дисциплин? Какое ему необходимо образование для того, что бы углубиться в эту новую область знаний?

Горн рассматривает вопросы преподавания дисциплин новой области знаний, отталкиваясь в своих рассуждениях от прагматических аспектов исследований в этой области: «Информационно-компьютерная наука отличается от лингвистики, психологии, философии и инженерных наук прагматическим ракурсом исследования тех же объектов. Например, студент, изучающий численный анализ, в процессе разработки или анализа какого-либо алгоритма позиционирует себя как математик в том случае, если его единственный прагматический интерес заключается в доказательстве существования алгоритма или определения его теоретической точности.



Если он позиционирует себя как будущий специалист в области информационно-компьютерной науки, то он рассматривает этот алгоритм с другой прагматической точки зрения: его реализации и обработки процессором, т.е. он интересуется эффективностью работы этого алгоритма, временными затратами, распределением памяти и т.д.

Аналогично, студент, изучающий процедуру адаптивного управления, описывающую процедуру поведения животного в некоторой ситуации, позиционирует себя как психолог в том случае, если его главной задачей является выяснение того, обладает ли он хорошей моделью поведения этого животного. Если его интересует проблема искусственного интеллекта, как одного из направлений информационно-компьютерной науки, то он интересуется применимостью этой процедуры независимо от того, является ли она моделью поведения животного или не является.

Студент, занимающийся грамматикой, мыслит себя как лингвист в том случае, если его больше всего интересует, действительно ли изучаемый естественный язык работает так, а не иначе. Однако он думает как будущий ученый в области информационно-компьютерной науки в том случае, если его занимает вопрос, каким образом можно использовать эту грамматику в информационных системах. Например, лингвист может рассматривать механизм стековой памяти, но с глубиной не более семи уровней из-за ограниченных возможностей локальной памяти человека, но для решения информационно-компьютерных задач такой глубины явно недостаточно» (41, с. 154).

Рассмотрев в статье 1963 г. эти примеры, Горн предлагает перечень тех дисциплин, которые должны преподаваться студентам, изучающим информационно-компьютерной науку, включая математику, физику, философию, лингвистику, психологию, вычислительную технику и компьютерное программирование.

Предложенный подход к изучению информационно-компьютерной науки уже тогда начал опробоваться в Пенсильванском университете. Через двадцать лет, в 1983 г., когда уже накопился опыт ее преподавания, Горн пишет, что его понимание концепции информационно-компьютерной науки заключается в том, что эта область знания не является ветвью математики, так как она должна соотносить себя с прагматическими вопросами, от которых математика не должна зависеть (40, с. 137).

Следует отметить, что процитированная статья 1983 г. начинается со следующей фразы: «Позвольте мне, прежде всего, выбрать более короткое название, чем информационно-компьютерная наука. Я выбираю термин «информатика», созвучный французскому Informatique и немецкому Informatik. Он несет в себе идею информации, а оканчивается так же, как и математика, подразумевая формализованную теорию. Плохо то, что при использовании слова «информатика» теряется компьютерная составляющая в названии, и кроме того, оно не вызывает ассоциаций с какой-либо экспериментальной основой» (40, с. 121).

Таким образом, используя в 1983 г. термин «информатика», Горн подразумевает под ним именно информационно-компьютерную науку.

Ученый обращается к истокам этой дисциплины, чтобы дать четкое определение информатике: «Все, что я до сих пор говорил о вычислениях, является ориентированным на практическую деятельность и связано с компьютером. Но сама теория вычислений уже сформировалась и существовала к тому времени, когда появились цифровые компьютеры. /…/ Специалисты в области символьной логики уже исследовали логические пределы вычислений;

была описана универсальная машина Тьюринга и доказана неразрешимость проблемы остановки;

Гедель продемонстрировал пределы формализма при помощи своих теорем о неразрешимости;

Черч, Клини и Карри проанализировали вычисления в теории рекурсивных функций и комбинаторной логике;

Туэ и Пост, а в более позднее время Марков, рассмотрели вычисления с синтаксической точки зрения. /…/ Поэтому, когда появились компьютеры, обсуждение лингвистики естественных языков Ноамом Хомским происходило в ракурсе вычислений.

/…/ В результате этих новых разработок появились лингвистические описания процессов программирования, математическая теория автоматов и формальные языки. Эти результаты, в свою очередь, повлияли на разработки языков программирования и программируемых вычислительных машин. /…/ Теперь под информатикой мы понимаем нечто, связанное с синтезом и анализом символьных выражений, а также синтез и анализ процессоров, которые интерпретируют, транслируют и обрабатывают такие выражения.

Если говорить более прозаично, то информатика занимается изучением, проектированием и использованием структур данных и их обработкой» (40, с. 131).

Главный вывод Горна о составе и статусе новой области знания, которым он завершает статью 1983 г., состоит в следующем: «…нам не следует отделять компьютерную науку от информационной науки, а следует пытаться отстаивать единую область знания – информатику. Любая попытка поощрить такое разделение /…/ повлечет за собой отделение практической деятельности от знаний, как это произошло с математикой Пифагора, риторикой софистов, метафизикой и органоном Аристотеля, грамматикой стоиков, логикой и грамматикой логических позитивистов.

Такое разделение будет причиной прекращения деятельного кипения, которое поддерживается сплавом знаний и практической деятельности» (40, с. 139-140).

Другой подход к позиционированию информатики как единой области знаний, охватывающей предметные области компьютерной и информационной наук, был предложен Ю.А. Шрейдером (28;

27). Результаты работы получены независимо от Горна, но идейно эти два подхода весьма близки. Например, в статье Шрейдера «Информация и знание» говорится, что не существует двух информатик (информационной науки и компьютерной науки), а есть два облика информатики. Первый из них (информационная наука) дополнительно нагружен представлениями о традиционном информационном обслуживании специалистов-ученых и инженеров в области их профессиональных интересов. Второй облик (компьютерная наука) неправомерно искажен чисто программистскими проблемами, не специфичными для информатики. Специфические же проблемы информатики оказываются там, где возникают задачи информационного представления знаний в форме, удобной для обработки, передачи и творческого реконструирования знаний в результате усилий пользователя (27, с. 51).

В этой же работе Ю.А. Шрейдер формулирует ряд положений научной парадигмы информатики: «…информация есть общественное достояние, она в принципе социальна, в то время как знание, вообще говоря, соотнесено с конкретной личностью, с тем, кто им владеет и непосредственно пользуется.

/…/ Информация должна пройти через "когнитивный экран" тех, для кого она представляет ценность. Так возникает необходимость считаться не только с существованием мира объективированного социализированного знания, т.е.

информации как превращенной формы знания, но и с феноменом личностного знания. /…/ Тождественность информации и знания при этом исключается, но информация как превращенная форма знания сохраняет следы своего происхождения. /…/ Наиболее принципиальные вопросы информатики всегда возникали на стыке информации и знания, там, где речь шла о превращении одного в другое». Далее Шрейдер пишет о пропасти, разделяющей информацию и знания как сущности разной природы (27, с. 50 51).

В наши дни, почти через 50 лет после первой работы Горна (41), мы наблюдаем следующий парадокс. С одной стороны, эти работы Горна редко вспоминают, о чем говорит приведенная таблица с их цитированием, построенная на основе данных Web of Science (http://apps.webofknowledge.com). Бурного развития идей Горна и Шрейдера и формирования информационно-компьютерной науки как единой фундаментальной дисциплины не наблюдается.

Год Цитируемость по Название статьи С. Горна публикации Web of Science The computer and information 1963 sciences: a new basic discipline The individual and political life of 1965 information systems Computer and information sciences 1967 and the community of disciplines The identification of the computer and information sciences: their 1968 fundamental semiotic concepts and relationships Informatics (computer and information 1982 (41), science): its ideology, methodology, 1983(46) and sociology С другой стороны, существует потребность в единой области знаний, научная парадигма которой должна охватывать предметные области компьютерной и информационной наук. Приведем три примера, иллюстрирующих потребность в разработке подобной парадигмы. Во первых, это перечень приоритетных направлений исследований и разработок по ИКТ 7-й Рамочной программы Европейского Союза, принятой на период 2007-2013 гг. Во-вторых, проблематика конкурса РФФИ 2011 г. по ориентированным фундаментальным исследованиям, в первую очередь, по разработке фундаментальных основ создания конвергентных технологий (см.

следующий раздел доклада). В-третьих, аналитический отчет по вопросам обеспечения конкурентоспособности США в 21 в., подготовленный Консультативным комитетом по информационным технологиям при Президенте США (32). Информацию об этом отчете можно также найти в работе (12).

В этом аналитическом отчете информационные технологии представляются как важная составляющая триады «научная теория – научный эксперимент – информационные технологии, обеспечивающие проведение эксперимента», являющейся основой процессов научного познания практически во всех областях знаний. Чтобы выразить в явной форме сферу применения, роль и функции информационных технологий в триаде научного познания, авторы отчета называют эту междисциплинарную область исследований и разработок «computational science», что буквально переводится как «вычислительная наука».

Определение этой области исследований и разработок, предлагаемое в отчете, имеет следующий вид (32, с. 10): «Вычислительная наука – это быстро растущая мультидисциплинарная предметная область, в которой используются возможности передового компьютинга (advanced computing) для понимания и решения сложных проблем. Вычислительная наука интегрирует три компонента:

алгоритмы (численные и нечисленные), программное обеспечение для моделирования и имитирования, разработанные для решения проблем естественных, гуманитарных и инженерных наук;

информационно-компьютерная наука, которая разрабатывает и оптимизирует современные аппаратные, программные и сетевые средства, а также компоненты управления данными, которые необходимы для решения вычислительно сложных проблем;

вычислительная инфраструктура, которая поддерживает решение научных и инженерных проблем, а также развитие информационно компьютерной науки»1.

В этом определении используется словосочетание информационно компьютерная наука, с помощью которого идея интеграции была отражена С. Горном в серии его статей. В аналитическом отчете по вопросам Computational science is a rapidly growing multidisciplinary field that uses advanced computing capabilities to understand and solve complex problems. Computational science fuses three distinct elements:

Algorithms (numerical and non-numerical) and modeling and simulation software developed to solve science (e.g., biological, physical, and social), engineering, and humanities problems;

Computer and information science that develops and optimizes the advanced system hardware, software, networking, and data management components needed to solve computationally demanding problems;

The computing infrastructure that supports both the science and engineering problem solving and the developmental computer and information science (32, с. 10).

обеспечения конкурентоспособности США в 21 в. информационно компьютерная наука понимается как одна из трех составляющих вычислительной науки. При этом описание предметной области информационно-компьютерной науки в этом отчете и в работах Горна отличаются.

Прежде чем перейти к основным разделам доклада, отметим, что приведенный далее опыт построения системы терминов не претендует на завершенность, поскольку семиотический термин «знаковая система», который будет использоваться в определении ряда терминов, требует отдельного рассмотрения. С учетом этого замечания предлагается следующая схема изложения.

Сначала дается описание тех направлений исследований по ИКТ и конвергентным технологиям, которые наиболее наглядно иллюстрируют необходимость интеграции компьютерной и информационной наук, а также тех направлений исследований, относящихся к когнитивным наукам, которые необходимы для разработки новых поколений ИКТ.

Затем дается краткое описание четырех составляющих парадигмы отрасли знаний (фундаментальной дисциплины) и предлагаются дефиниции 12 терминов информационно-компьютерной науки, ориентированных на интеграцию компьютерной и информационной наук, а также на создание фундаментальных основ разработки новых поколений ИКТ и конвергентных технологий в предметной области информационно-компьютерной науки. При этом в рамках доклада останутся неопределенными понятия личностных и коллективных концептов.

В завершение доклада будет показано, что предлагаемая система терминов информационно-компьютерной науки дает возможность интегрировать основные подходы к построению оснований информационной науки.

1. Приоритетные направления исследований по ИКТ и конвергентным технологиям 1.1. О конвергентных технологиях в конкурсе РФФИ 2011 г. по ориентированным фундаментальным исследованиям В марте 2011 г. Российский фонд фундаментальных исследований (РФФИ) провел конкурс ориентированных фундаментальных исследований по 23 междисциплинарным темам (конкурс «офи-м» 2011), включая тему «Фундаментальные основы конвергентных технологий» (1). По всем темам поступило 1137 заявок, из которых 468 получили гранты на выполнение проектов, в том числе 322 гранта получили институты РАН. По теме «Фундаментальные основы конвергентных технологий» поступило чуть более 40 заявок, из которых почти половина получила гранты на выполнение проектов, в том числе гранты на следующие проекты (20;

23):

Исследование и разработка нейроморфных средств и сложных антропоморфных технических систем (модели восприятия информации, накопления знаний о среде и поведении путем обучения в реальном времени) – Станкевич Л.А.;





Исследование ритмических кодов мыслительной деятельности и создание на этой основе модели когнитивного пространства человека и интерфейса мозг-компьютер высокого уровня (технология определения типа совершаемых в уме мысленных действий по рисунку электроэнцефалограммы, распределение ритмов мозга по амплитуде, частоте и топографии для отдельных видов мышления:

пространственного, образного, вербально-логического и смешанных форм, количественная оценка расстояния между разными видами мышления с определением их координат на модели когнитивного пространства) – Иваницкий А.М.;

Разработка фундаментальных принципов и моделей механизмов категоризационной деятельности и обучения в нейрокогнитивных функциональных системах разработки фундаментальных (проблема принципов и моделей механизмов категоризационной деятельности - вопроса о том, как мозг формирует новые когнитивные категории, концептуально дробя не размеченный заранее физический мир) – Анохин К.В.;

Когнитивные основы конвергентной технологии распознавания речи множество паттернов для конвергентной технологии (обучающее автоматического распознавания речи) – Устинин М.Н.

Названия и краткие описания проектов позволяют получить первое представление о проблематике проектов по теме «Фундаментальные основы конвергентных технологий». В одних проектах по этой теме когнитивные технологии интегрированы только с ИКТ. В других – рассматриваются вопросы взаимопроникновения нано-, био-, инфо-, когнитивных технологий.

В рамках этого конкурса РФФИ конвергенция, взаимопроникновение нано-, био-, информационных и когнитивных наук и технологий представлена как фактор формирования принципиально новой технологической базы цивилизации, основанной на воспроизведении систем и процессов живой природы в виде технических систем и технологических процессов, в том числе в виде информационно-компьютерных систем и процессов.

Меры, направленные на развертывание работ в области конвергентных наук и технологий, предпринимаются рядом стран. В частности, в США действует программа Национального научного фонда и Министерства торговли США под названием NBIC – «Nanotechnology, Biotechnology, Information technology and Cognitive science». Все эти программы направлены на решение крупных социальных задач. Так, программа США называется «Converging Technologies for Improving Human Perfomance», а программа Европейского союза – «Converging Technologies for the European Knowledge Society) (1).

В рамках доклада ограничимся вопросами создания фундаментальных основ взаимопроникновения информационных, компьютерных и когнитивных технологий. Их конвергенцию трудно реализовать в рамках только информационной науки (information или только science) компьютерной науки (computer science) (11;

10). Для их конвергенции и нужна единая области знаний, научная парадигма которой должна охватывать предметные области компьютерной и информационной наук, а также ряд направлений исследований, относящихся к когнитивным наукам.

Направления исследований, относящиеся к когнитивным наукам и необходимые для создания новых поколений ИКТ, рассматривалась приглашенными экспертами при подготовке 7-й Рамочной программы ЕС в рамках семинара «Knowledge Anywhere Anytime: “The Social Life of Knowledge”». Этот семинар состоялся 29–30 апреля 2004 г. в Брюсселе (36).

Материалы этого семинара использовались затем при формировании программ работ по ИКТ 7-й Рамочной программы ЕС (44-46).

В этих материалах отмечается, что исследование процессов, разработка методов и моделей формирования новых и развития существующих систем знаний является актуальной задачей. Одновременно фиксируется тот факт, что эта проблематика со временем эволюционирует. Участники семинара определили следующие четыре актуальных направления исследований в рамках этой проблематики (36).

Задачей первого направления является формирование научного понимания того, как знания появляются, каким образом на этот процесс и его результаты влияет совместная деятельность, как формируются конвенциональные системы знаний. Одна из задач этого направления заключается в определении различий в понимании участниками совместной деятельности одного и того же текста, изображения и т.д.

Задачей второго направления является исследование многообразия форм представления одних и тех же концептов2, одной и той же системы знаний. Кроме форм представления конвенциональных и стабильных концептов, предметом исследования являются формы представления личностных и согласованных концептов, а также процессы возникновения и эволюции нестабильных концептов. В рамках этого направления предполагается выполнение исследований процессов формирования конвенциональных концептов на основе личностных и согласованных концептов.

Задачей третьего направления является создание нового поколения интеллектуальных информационных систем, которые должны обеспечить семантическую интероперабельность в процессе совместной работы пользователей этих систем. Если следовать описанию семиуровневой модели интероперабельности Р. Будденберга, то семантическая интероперабельность имеет отношение к следующим двум уровням этой модели: когнитивная интероперабельность (6-й уровень семиуровневой модели) и доктринальная интероперабельность (7-й уровень). В соответствии с определением Р. Будденберга реализация когнитивной интероперабельности предполагает обеспечение согласованного понимания участниками совместной деятельности одного и того же текста, изображения и т.д. Реализация доктринальной интероперабельности предполагает не только согласованное понимание, но и принятия участниками совместной деятельности согласованных решений на основе одного и того же текста, изображения и т.д. (31;

30).

В рамках третьего направления, помимо создания методов и средств поддержки семантической интероперабельности в интеллектуальных информационных системах, планируется исследовать вопросы выявления и В описаниях направлений исследований под концептом понимается структурный элемент системы знаний человека, принадлежащий ментальной среде.

экспликации основных стадий эволюции систем знаний, представленных в виде классификационных систем, тезаурусов, онтологий и моделей других категорий (представленных в процессе совместной работы пользователей информационных систем). При этом не предполагается, что пользователи заранее будут владеть согласованной между ними системой терминов и единым пониманием принципов формирования эволюционирующих систем знаний.

Степень новизны интеллектуальных систем представления знаний предлагается оценивать на основе их сравнения с традиционными системами «управления знаниями» (knowledge management systems), основанными на гипотезе постоянства знаний человека, предполагающей, что эволюцию систем знаний во времени можно не учитывать, а личностные, согласованные и конвенциональные концепты не различать.

Задачей четвертого направления является исследование принципиальных возможностей и средств влияния на процессы формирования новых систем знаний в процессе совместной деятельности коллективов специалистов, в том числе пространственно-распределенных коллективов, совместная деятельность которых обеспечивается сетевыми технологиями. При этом предполагается, что имеет место ситуация неполноты или лакунарности уже имеющихся систем знаний, эта неполнота специфицирована и перед коллективом специалистов поставлена задача уменьшения степени неполноты.

Речь идет об уменьшении степени неполноты или лакунарности систем знаний, ориентированных на удовлетворение технологических, экономических, образовательных и других социально значимых потребностей общества. В рамках этого направления предлагается исследовать, какими видами перспективных ИКТ и до какой степени можно оказывать влияние на процессы формирования коллективами специалистов новых систем знаний, отвечающих социально значимым потребностям и необходимых для получения запланированных результатов. Именно возможность оказывать влияние на процесс формирования новых систем знаний является, по мнению участников семинара «Knowledge Anywhere Anytime: “The Social Life of Knowledge”», характерной чертой общества, основанного на знаниях.

Приведенный перечень из четырех направлений исследований говорит о том, что участники этого семинара придают ИКТ ключевую роль в решении проблем формирования новых и развития существующих систем знаний. При этом они существенно расширяют границы предметной области генерации и представления знаний за счет рассмотрения ИКТ и их влияния на процессы целенаправленной генерации (формирования) и эволюции систем знаний во времени.

Перечисленные четыре направления и результаты анализа, проведенного приглашенными экспертами, позволяют сделать вывод о том, что предлагаемая ими расширенная предметная область исследований процессов формирования и представления знаний включает в себя, в дополнение к традиционным задачам представления знаний, следующие три проблемы:

формирование и компьютерное представление в цифровой электронной среде3 личностных и согласованных концептов как структурных элементов систем знаний, формируемой коллективами специалистов;

анализ и оценивание степени релевантности разных вариантов формируемых систем знаний социальным, экономическим, технологическим и другим общественно значимым потребностям, в интересах которых они были сформированы;

Согласно ГОСТ Р 52292-2004, электронная среда – это среда технических устройств (аппаратных средств), функционирующих на основе физических законов и используемых в информационной технологии при обработке, хранении и передаче данных. В докладе цифровая электронная среда – это цифровые технические устройства (цифровые аппаратные средства) электронной среды.

целенаправленное влияние средствами ИКТ на формирование и эволюцию формируемых систем знаний, необходимое для получения запланированных результатов.

1.2. Тематическая программа по ИКТ 7-й Рамочной программы ЕС Программу работ по реализации исследований в четырех перечисленных направлениях содержат документы 7-й Рамочной программы Европейского Союза, принятой на период 2007-2013 гг. В документах этой программы сформулировано восемь приоритетных направлений исследований и разработок, включая в качестве отдельного направления «Перспективные ИКТ» (34;

33;

44-46;

36).

Цели проектов, финансируемых в рамках приоритетного направления «Перспективные ИКТ», в тематической программе по ИКТ на 2007-2008 гг.

сформулированы следующим образом: «Своевременная идентификация и обоснование новых тематических направлений исследований и разработок, которые имеют большой научно-технический потенциал и могут стать основой для разработки ИКТ следующих поколений4. Эти проекты должны включать междисциплинарные исследования новых и альтернативных подходов к разработки ИКТ будущего и быть нацеленными на фундаментальное переосмысление системы теоретических, прикладных, методологических и технологических принципов, подходов и понятий (выделено мной – И.З.), используемых сегодня в сфере ИКТ» (44, с. 54).

Важно отметить, что в цитируемом документе можно найти обоснование конкурсных тем в рамках приоритетного направления «Перспективные ИКТ», включая тему «ИКТ долговременного применения», в описании В цитируемом документе подчеркивается, что для разработки ИКТ следующих поколений особенно важны инновационные исследования и разработки, а не поэтапная модернизация существующих и используемых сегодня теоретических, прикладных, методологических и технологических принципов, подходов и понятий в сфере ИКТ.

проблематики которой говорится о необходимости разработки новых подходов к генерации, представлению и сохранению личностных знаний человека, их интеграции в цифровой электронной среде и глобальному использованию (44, с. 57-63).

Сфера применения результатов исследований и разработок по конкурсной теме «ИКТ долговременного применения», его цели и задачи сформулированы следующим образом: «Широкое распространение и применение ИКТ, информационно-компьютерных и других цифровых систем в социально-значимых сферах деятельности кардинально увеличивает требования к их надежности, безопасности и долговечности. Это требует новых решений для того, чтобы обеспечить доверие пользователей в процессе их использования, защитить от несанкционированного к ним доступа и сохранить их функциональность в течение долгого периода времени в условиях крайне децентрализованной и быстрой смены поколений ИКТ, информационно-компьютерных и других цифровых систем». Далее формулируются актуальные исследовательские проблемы в рамках темы «ИКТ долговременного применения». Приведем формулировки двух проблем (44, с. 62-63):

1) разработать теоретические и прикладные основы создания долговечных систем, обеспечивающих их эволюцию при минимизации затрат на их развитие в условиях многократной смены поколений программно-аппаратных и сетевых средств и/или форматов данных. Другими словами, долговечные системы должны быть способны к сохранению своей первоначальной социально-значимой функциональности в течение долгого периода времени и изменять ее в случае необходимости. Методы сохранения и изменения функциональных возможностей должны быть машинно независимыми и должны обеспечивать устойчивую эволюцию долговечных систем;

2) разработать новые подходы к представлению и сохранению знаний, ориентированные на долговременный и безотказный к ним доступ в условиях локальной генерации отдельных «квантов» знаний, их интеграции, а также глобального использования систем представления и сохранения знаний с учетом контекста и временной эволюции систем. При этом должна быть обеспечена долговременная устойчивость систем представления и сохранения знаний в условиях многообразия их использования и эволюции семантики во времени.

Таким образом, в документах тематической программы по ИКТ 7-й Рамочной программы Европейского Союза четко обозначена потребность в разработке научных основ создания ИКТ следующих поколений. При этом потребность в разработке фундаментальных основ создания ИКТ следующих поколений иногда формулируется в косвенной форме и нередко является импликатурой (следствием) приведенных формулировок актуальных исследовательских проблем.

Например, фраза «локальная генерация отдельных "квантов" знаний … »

во второй проблеме подразумевает возможность членения знаний на «кванты» некоторым способом, их представления в цифровой электронной среде и обеспечение доступа к сохраненным представлениям «квантов»

знаний и отношениям между ними. Эти вопросы рассматриваются далее в докладе, так как они являются ключевыми для определения предметной области, интегрирующей одновременно компьютерную и информационную науки, а также ряд направлений исследований, относящихся к когнитивным наукам.

В соответствии с рассмотренными приоритетными направлениями исследований по ИКТ сформулируем четыре ключевых вопроса, на которые необходимо ответить при описании любого варианта парадигмы единой области знаний, охватывающей предметные области компьютерной и информационной наук, если ставится цель предложить вариант научной парадигмы, ориентированной на создание новых поколений ИКТ.

Во-первых, допускает ли предлагаемый вариант парадигмы возможность членения системы знаний на «кванты»? Если ответ «да», то допускается только единственный способ членения системы знаний на «кванты» или предполагается существование множества разных способов?

Во-вторых, используется ли категоризация «квантов» знаний по степени их конвенциональности? Существует ли категория личностных «квантов»

знаний, которые их автором ни с кем не согласованы? Если ответ «да», то с помощью каких процессов происходит преобразование личностных «квантов» знаний в конвенциональные?

В-третьих, допускается ли пополнение и эволюция системы знаний во времени или в предлагаемом варианте парадигме знания человека в разные моменты времени являются самотождественными?

В-четвертых, учитывается ли разделение знания человека на имплицитные, которые не выражены им в явном виде, и эксплицитные знаний? Если ответ «да», то допускает ли предлагаемый вариант парадигмы частичную экспликацию и фиксируются ли моменты времени частичной экспликации имплицитных знаний?

Отметим, что фраза «эволюция семантики во времени» в формулировке второй проблемы в рамках темы «ИКТ долговременного применения» имеет непосредственное отношение к третьему вопросу. Все четыре перечисленных вопроса являются ключевыми для описания парадигмы информационно компьютерной науки. Далее в докладе предлагается ответ только на первый вопрос.

2. Четыре составляющих парадигмы отрасли знаний (фундаментальной дисциплины) В соответствии с концепцией А. Соломоника научная парадигма любой «зрелой» науки состоит из следующих четырех составляющих, которые могут разрабатываться отдельно, но объединяются в единую и цельную конструкцию (22, с. 23-24):

философские основания;

аксиоматика;

классификация объектов исследования, процессов и явлений с указанием тех сред (например, ментальной, социально-коммуникационной, цифровой электронной или материальной), к которым они относятся (добавлено мной – И.З.);

система терминов.

Сам термин «научная парадигма» трактуется Соломоником в соответствии с теорией Т. Куна (16). При этом он отмечает, что в книге Куна мы не находим ответа на вопрос: «Из чего должна состоять парадигма любой «зрелой» науки?» (22, с. 23).

В рамках концепции Соломоника реализацию идей Горна и Шрейдера об интеграцию компьютерной и информационной наук можно представить как описание парадигмы единой области знаний, охватывающей предметные области компьютерной и информационной наук, с общими философскими основаниями, включая позиционирование этой области знаний в системе современного научного мировоззрения, с общей аксиоматикой, единой классификацией объектов, процессов и явлений этой области знаний, а также с общей системой терминов.

Что касается последней составляющей научной парадигмы (системы терминов информационно-компьютерной науки), то здесь также необходимо учитывать существующие трудности перевода с одного естественного языка на другой. Например, в английском языке существует, как минимум, четыре устойчивых словосочетания – information science, computer science, computer and information science, computational science – которые нередко переводятся на русский язык одним словом «информатика». Приведенные англоязычные словосочетания обозначают разные научные дисциплины и сферы их приложения. Однако при переводе на русский язык этих словосочетаний одним словом «информатика» содержательные отличия этих наук, различие их предметных областей и сфер приложений не отражаются лексически.

Кроме того, в английском и русском языках разные по смыслу базовые понятия информационной науки (information science), компьютерной науки (computer science), информационно-компьютерной науки (computer and information science) и вычислительной науки (computational science) также часто лексически выражены одним словом, что затрудняет сравнительное описание предметных областей и приложений этих дисциплин. Например, слово «information – информация» при его использовании в перечисленных предметных областях может трактоваться по-разному. Различия в трактовках слова «информация», существенные для этого доклада, рассматриваются далее в разделе 4.2 и работах (11;

10).

Для описания парадигмы единой области знаний, охватывающей предметные области компьютерной и информационной наук, необходимо явно определить значения используемых терминов. Роль явного определения системы терминов и смысла базовых понятий в любой области знаний отметил В.Ф. Турчин в своей книге «Феномен науки». Он писал:

«Собственно говоря, ввести основные понятия – это и значит уже определить данную науку, ибо остается только добавить: описание мира с помощью этой вот системы понятий и есть данная конкретная наука» (24, с. 17).

Применяя это положение к предметной области доклада, можно сказать, что явно зафиксировать базовые понятия и определить систему терминов для описания парадигмы единой области знаний, охватывающей предметные области компьютерной и информационной наук, и значит уже во многом определить ее научную парадигму. Поэтому описание научной парадигмы предлагается начать именно с построения системы терминов.

Здесь возникает закономерный вопрос о тех моментах (периодах) времени, когда сами компьютерная и информационная науки по отдельности стали «зрелыми» науками? Этот вопрос выходит за пределы настоящего доклада и заслуживает самостоятельного изучения. Однако отметим, что в 1980 г. один из классиков информационной науки писал: «Едва ли теоретическая информационная наука уже существует. Я различаю рассеянные обрывки теории, некоторые из которых имеют более или менее стройный вид, но, все же, они не складываются в единую область знаний.

Поэтому общих допущений (явных или неявных), которые могли бы претендовать на теоретические основания, попросту не существует.

Информационная наука рассматривает большое число приложений, которые все больше требуют участия компьютера. Ни о каких основаниях она не может заявлять, если опирается только на здравый смысл в области языковых исследований, коммуникаций, отношений знаний и информации, на приложения компьютерных и телекоммуникационных технологий. Однако состояние компьютерной науки не намного лучше. В философском отношении информационная наука пребывает в подвешенном состоянии, так как у нее нет теоретических оснований» (29, с. 125).

Ответы на четыре вопроса, сформулированных в конце предыдущего раздела, затрагивают все четыре составляющих научной парадигмы информационно-компьютерной науки. К философским основаниям парадигмы относится вопрос: «Являются ли знания человека в разные моменты времени самотождественными (18)»? В работе (9) вопрос о возможности членения знаний на «кванты» предлагается относить к аксиоматике этой области знаний. В классификации объектов, процессов и явлений единой области знаний необходимо описать процессами генерации личностных «квантов» знаний, а также процессы их преобразования в конвенциональные знания, например, как их согласование в процессе совместной деятельности.

3. Построение системы терминов информационно-компьютерной науки как составляющей ее научной парадигмы Построение системы терминов информационно-компьютерной науки базируется на следующих пяти исходных положениях:

средовой принцип разделения предметной области информатики согласно структуре научных исследований, предложенной К.К. Колиным (13;

15;

14), соотнесение объектов предметной области информационно компьютерной науки со средами (ментальной, социально коммуникационной, цифровой) по признаку принадлежности рассматриваемых объектов (например, концепты, информация и коды) к этим средам (6;

37), определение сферы незнания как сферы мысленно представляемого, но еще не познанного, через ее противопоставление со сферой знания, предложенное В.Л. Макаровым и Г.Б. Клейнером (17, с. 31-32), разграничение между знаковой информацией и данными по источнику их генерации, предложенное Ю.И. Шемакиным: человек как генератор знаковой информации и внешние по отношению к человеку технические цифровые измерительные системы как генераторы данных (25), разграничение личностных, согласованных (коллективных) и общепринятых (конвенциональных) знаний согласно обобщенной модели формирования знаний Вежбицки и Накамори (52;

53).

3.1. Ключевые слова описания предметной области информационно компьютерной науки В информационной и компьютерной науках широко используются слова «знания», «информация», «данные», каждое из которых имеет несколько значений, а иногда каждое из этих слов используется для обозначения разных несвязанных между собой сущностей. С лингвистической точки зрения такие слова часто являются либо частичными омонимами (одинаково звучащие слова, не имеющие общих элементов смысла, но связанные ассоциативно), либо полными омонимами (одинаково звучащие слова, не имеющие общих элементов смысла и не связанные ассоциативно) (26;

49).

Если выбирать те или иные уже существующие определения слов «знания», «информация» и «данные», а затем проанализировать формулировку некоторой проблемы, то ее смысловое содержание нередко будет зависеть от определения значений перечисленных слов (5, с. 36-43;

8).

По этой причине сначала необходимо определить (построить) систему терминов и только затем использовать их для описания парадигмы информационно-компьютерной науки.

Согласно Г.А. Диановой «термин – это знак специальной семиотической системы, обладающий номинативно-дефинитивной функцией» (4). Согласно другому определению понятия «термин»5, его главным свойством является системность (2), т.е. принадлежность каждого термина некоторой системе терминов или терминосистеме.

Начнем с термина «ментальные знания» (далее кратко – знания), которые предлагается определить как результаты познавательной и К особенностям терминов области науки, дисциплины, научной школы, концепции, программного документа и принципам их построения относятся: 1) системность;

2) наличие дефиниции;

3) тенденция к моносемичности в пределах терминологического поля своей терминосистемы;

4) отсутствие экспрессии;

5) стилистическая нейтральность (2, с. 508).

креативной деятельности человека, носителем которых может быть только человек и в которых могут быть выделены отдельные «кванты» знаний.

Информацию определим как 1) авторские, 2) коллективные или 3) общепринятые формы 4) эксплицитного (явного) и 5) отчужденного от человека представления его знаний, предназначенные для 6) передачи, 7) непосредственного сенсорного восприятия и 8) понимания их другими людьми. Это определение, по сути, представляет собой выбор для слова «информация» как частичного омонима одной дефиниции из существующего спектра дефиниций феноменов, обозначенных этим словом, и соответствующих им смысловых значений (49;

5).

«Кванты» знаний будем называть концептами, если они могут быть выражены в рамках некоторого естественного языка (в общем случае, в рамках знаковой системы). «Кванты» знаний, которые не могут быть выражены в рамках известных знаковых систем, будем называть ментальными единицами невыраженных знаний человека. Предполагается, что деление знаний на концепты зависит от используемой знаковой системы (см. рис. 1). Множество концептов, выражаемых в рамках одной знаковой системы, будем называть ее планом содержания, а формы выражения этих концептов – ее планом выражения.

Иначе говоря, определение термина «концепты» предполагает, что они являются результатом процесса членения знаний человека на «кванты», которые могут быть выражены в рамках некоторой знаковой системы, т.е.

процесс членения связан с процессом выражения знаний человека в сенсорно воспринимаемой и отчужденной от человека форме, например, в виде текста на естественном языке и/или в виде изображения.

В системе выраженных знаний человека могут быть выделены несколько планов содержания в зависимости от числа тех языков или знаковых систем, которые он использует для представления своих знаний в отчужденной форме. На рис. 1 изображено два плана содержания в ментальной среде (обозначены как А и Б), соответствующие двум разным знаковым системам.

Предположим, что на рис. 1 для описания одних и тех же знаний используются русский язык (план содержания А) и английский язык (план содержания Б). Тогда каждому из этих двух планов содержания, полученных в результате членения одной и той же системы знаний, будет соответствовать свой план выражения в социально-коммуникационной среде. На рис. каждый план выражения обозначен двумя книгами (две на русском языке и две книги, например, их переводов на английский). Граница между ментальной и социально-коммуникационной средами обозначена штриховой линией.

ис. Рис. 1. Две среды, планы содержания и выражения, знаковая система Минимальные единицы плана содержания, имеющие значение, будем называть элементарными концептами некоторой знаковой системы. Здесь необходимо отметить разницу между элементарным концептом и значением слова или устойчивого словосочетания, когда речь идет о естественном языке.

В докладе везде рассматривается только сигнификативный аспект значения. Экспрессивно-эмоциональные оценки и коннотации не рассматриваются, а соответствующие им понятия исключены из рассмотрения. Таким образом, термины «концепт» и «элементарный концепт» используются для обозначения только сигнификативной составляющей слова (3).

Термин «знаковая информация» определим как результаты процесса представления концептов человеком-генератором этих результатов в плане выражения в любой отчужденной форме, которая является сенсорно воспринимаемой другими участниками коммуникаций и содержательно интерпретируется ими в рамках некоторой знаковой системы. Отметим, что при таком определении термин «знаковая информация» имеет отношение только к знаковым формам представления концептов, а введенный ранее термин «информация» – к любым формам представления «квантов» знаний.

Словосочетание «знаковая информация» является неисчисляемым, что не всегда удобно для описания проблем компьютерного представления знаний. Поэтому, определим следующие термины с использованием исчисляемых существительных.

Представление в плане выражения элементарных концептов в виде сенсорно воспринимаемых форм с помощью некоторой знаковой системы будем называть элементарными информационными объектами.

Сенсорно воспринимаемые формы представления любых концептов, включая элементарные, будем называть информационными объектами.

Выделение в системе выраженных знаний человека нескольких планов содержания позволяет учесть различия в членении знаний на концепты и в отношениях между ними в разных естественных языках как знаковых системах. Например, в английском языке есть следующие пять основных значений существительного «office» (51):

1) место выполнения профессиональных обязанностей;

2) функция или должностные обязанности (it is my office to open the mail – ‘в мои обязанности входит вскрывать почту’);

3) должность в организации или позиция в иерархии;

4) ведомство, министерство, управление, организация или административная единица (Foreign Office – ‘Министерство иностранных дел’);

5) сотрудники организации или ее подразделения (the whole office was late the morning of the blizzard – ‘из-за снежной бури утром целый офис опоздал на работу’).

В этом примере английскому слову «office» соответствует пять значений и, следовательно, пять разных элементарных концептов, являющихся значениями существительного «office» в английском языке. Однако в других языках для представления отдельных значений необходимые слова могут отсутствовать. Например, как отмечается в материалах проекта EuroWordNet (51), в испанском и итальянском языках нет слов для выражения пятого значения в приведенном примере для слова «office». Таким образом, выделение нескольких планов содержания позволяет учесть различия в членении выраженных знаний на концепты в разных естественных языках.

Термин «коды» определим как компьютерные эквиваленты двоичных цифр (или их последовательностей), которые могут представлять собой намагниченность или ее отсутствие, наличие электрического тока или его отсутствие, способность к отражению света или ее отсутствие в цифровой электронной среде (48, с. 86).

Двоичные цифры «0» и «1», о которых говорится в определении термина «коды» принадлежат социально-коммуникационной среде, а их компьютерные эквиваленты – цифровой электронной среде. Будем выделять среди всех возможных кодов цифровой среды три следующих категории:

коды, соотнесенные с концептами в качестве их «представителей» в цифровой среде, например коды концептов (смыслового содержания) индикаторов (первая категория) (7), коды, соотнесенные с информационными объектами как эксплицитными и отчужденными от человека формами представления концептов в плане выражения социально-коммуникационной среды в качестве «представителей» этих форм в цифровой среде, например коды имен индикаторов (вторая категория) (47), коды, соотнесенные с денотатами любой природы в качестве их «представителей» в цифровой среде, например коды денотатов индикаторов как совокупностей их программ, данных и значений (третья категория) (47).

Термин «коды» в предлагаемой системе терминов имеет синоним «цифровые коды». Коды первых трех категорий будем называть цифровой информацией.

Также определим еще одну (нулевую) категорию кодов, которую будем называть «цифровыми данными» и к которой будем относить все коды цифровой среды, не относящиеся в явном виде к трем выше определенным категориям. Таким образом, к цифровым данным будем относить результаты любых измерений, полученных с помощью любых цифровых технических систем (устройств) и не являющихся результатом представления знаний человека.

Формы представления цифровых данных в социально коммуникационной среде в сенсорно воспринимаемой форме будем называть данными. Отметим, что данные могут сопровождаться метаданными, являющиеся особым видом знаковой информации. Ментальные образы сенсорно воспринимаемых данных будем рассматривать как ментальные структурные единицы невыраженных знаний человека, не являющиеся концептами и соответствующие этим данным.

Перечислим те термины, которые были выделены полужирным шрифтом, распределив их между ментальной, социально-коммуникационной и цифровой электронной средами, подчеркнув те три слова, которые будем называть первичными понятиями системы терминов:

знания, «кванты знаний», ментальные единицы, концепты и элементарные концепты (ментальная среда), информация, знаковая информация, информационные объекты, элементарные информационные объекты и данные (социально коммуникационная среда), коды, цифровая информация, цифровые коды и цифровые данные (цифровая среда).

В докладе ставится задача построения такой системы терминов на основе первичных понятий, чтобы в ее рамках разные объекты, сущности и явления, упоминаемые в описании парадигмы информационно компьютерной науки и относящиеся к разным средам, назывались по разному, а одинаковые объекты, сущности и явления – одинаково с точности до явно определенных синонимов, например цифровые коды как термина «коды».

Построение системы терминов было начато с определения трех первичных терминов (знания, информация, коды). Однако процесс построения, приведенный в этом докладе, не претендуют на завершенность, так как семиотический термин «знаковая система», который используется в определении ряда терминов, требует отдельного рассмотрения и поэтому еще одного доклада потребует продолжение построения системы терминов.

Приведем пример, иллюстрирующий использование термины «коды»

применительно к концептам и формам их представления. Возьмем небольшой фрагмент УДК (рис. 2) и рассмотрим родовидовые отношения концепта «Представление знаний» с другими концептами этого фрагмента. В УДК концепт «Представление знаний» располагается на пятом уровне иерархии, имеет номер 004.82 и включает в себя 6 концептов шестого уровня с номерами от 004.822 до 004.827. Отметим, что все эти 6 концептов в УДК являются терминальными, то есть дальнейшее их видовое членение в УДК отсутствует.

Концепт «Представление знаний» включен в концепт «Искусственный интеллект» четвертого уровня, который, в свою очередь, включен в концепт «Информационные технологии. Вычислительная техника. Теория.

Технология и применение вычислительных машин и систем» третьего уровня и т.д. до концепта «Общий отдел. Наука и знание. Информация.

Документация. Библиотечное дело. Организации. Публикации в целом»

верхнего уровня. Для компьютерного представления перечисленных концептов можно использовать двоичные коды номеров рубрик УДК, к которым добавлена литера «к». Например двоичный код номера «004.82к»

как код первой категории можно использовать для концепта «Представление знаний», а в качестве кода второй категории для формы представления этого концепта на русском языке можно использовать двоичный код этого же номера рубрики с добавлением литеры «р» – «004.82р», а на английском языке (“Knowledge representation”) – двоичный код «004.82а».

Отметим, что само по себе использование номеров рубрик для построения кодов только первой и второй категорий мало что добавляет к формированию и представлению знаний. Как было показано при описании концептуальных основ представления экспертных знаний, роль подобной нумерации принципиально изменится, если в процессе формирования экспертных знаний одновременно используются коды третьей категории для объектов интерпретации как денотатов концептов. Их использование дает возможность кодировать те денотаты, которые еще не имеют смысловой интерпретации или интерпретированы только частично, что имеет принципиальное значение для компьютерного моделирования процессов формирования новых концептов и систем знаний с учетом динамики их формирования (47).

Таким образом, существенным элементом новизны предлагаемой системы терминов является введение кодов третьей и нулевой категорий.

При этом разделение кодов на категории и их использование в задачах компьютерного кодирования дает возможность по значениям кодов однозначно установить первоисточники кодов: человек для цифровой информации и внешние по отношению к человеку цифровые технические системы и устройства для цифровых данных (52). 0 - Общий отдел. Наука и знание. Информация. Документация.

Библиотечное дело. Организации. Публикации в целом.

00 - Общие вопросы науки и культуры. Пропедевтика.

004 - Информационные технологии. Вычислительная техника.

Теория. Технология и применение вычислительных машин и систем.

004.8 - Искусственный интеллект.

004.82 - Представление знаний.

004.822 - Сети знаний. Семантические сети.

004.823 - Фреймовые системы. Фреймы. Схемы.

Сценарии.

004.824 - Множественные миры.

004.825 - Порождающие системы. Системы правил вывода.

004.826 - Модель черной доски.

004.827 - Представление неоднозначности.

Неопределенность. Пробелы знаний.

Рис. 2. Родовидовые отношения концепта «Представление знаний»

с другими концептами УДК и их коды 3.2. Сопоставление значений терминов Основная цель этого раздела доклада заключается в сопоставлении введенных дефиниций терминов информационно-компьютерной науки «знания», «информация», «коды» и «данные» с аналогичными дефинициями, используемыми в информационной науке. В этом разделе результаты сопоставления излагаются согласно работам (11;

10).

В информационной науке определения термина «информация»

формулировались по-разному, как правило, на основе двух ключевых положений, суть которых заключается в следующем.

С одной стороны (первое положение), в информационной науке информация тесно связана с процессом представления знаний человека в виде отчужденных форм, которые должны сенсорно восприниматься другими людьми, являющимися получателями этих форм. При этом должна учитываться модель представления знаний получателя.

С другой стороны (второе положение), содержание термина «информация» должно учитывать, что при восприятии и осознании отчужденных форм их получателем его знания могут подвергаться влиянию и трансформированию (47).

Оба эти положения будут далее использоваться при сопоставлении введенных дефиниций терминов информационно-компьютерной науки с аналогичными дефинициями, используемыми в информационной науке, но сначала рассмотрим только первое положение.

Важно отметить, что оно допускает два варианта толкования, отличия которых и послужили причиной появления в информационной науке разных определений термина «информация» с существенно разным смысловым содержанием.

Первое толкование заключается в том, что это положение включает два утверждения:

1) информация возникает в процессе представления знания человека в виде отчужденных и сенсорно воспринимаемых форм;

2) информация является непосредственным результатом процесса представления знания человека в виде отчужденных и сенсорно воспринимаемых форм, например, слов и предложений текста на естественном языке.

Второе толкование первого положения заключается в том, что оно включает также два утверждения, первое из которых то же самое, но второе утверждение принципиально отличается:

1) информация возникает в процессе представления знания человека в виде отчужденных и сенсорно воспринимаемых форм;

2) информация не является непосредственным результатом процесса представления знания человека в виде отчужденных и сенсорно воспринимаемых форм, а происходит в два этапа: первый этап этого процесса представляет собой членение знаний человека на концепты в соответствии с некоторой знаковой системой, которые на втором этапе могут быть представлены в виде отчужденных и сенсорно воспринимаемых форм.

Принципиальное отличие этих двух вариантов толкования первого положения заключается в том, что в первом варианте информация идентична отчужденным формам и относится к социально-коммуникационной среде.

Во втором варианте толкования информация идентична концептам и относится к ментальной среде.

С учетом отмеченных различий в толковании первого положения, в этом параграфе рассмотрим эти два основных варианта определения термина «информация» в информационной науке и сопоставим их с содержанием термина «информация», предложенным в данной работе.

По мнению Дж. Фаррадейна в информационной науке мы изучаем ментальные креативные процессы, с которыми связано генерирование информации, и ментальные познавательные процессы, которые связаны с получением и интерпретацией информации. Чем больше мы изучаем ментальные процессы этих двух видов, тем больше возможностей у нас улучшать и контролировать процессы хранения и поиска информации для получения желаемых результатов (35, с. 75). Отметим, что Фаррадейн сначала использует слово «информация» без явного его определения как термина, и только потом он определяет его.

Фаррадейн сопоставляет знания и информацию, их отношения в процессах передачи информации, ее трансформации в знания как центральные понятия и процессы информационной науки. Картина событий при передаче информации в социально-коммуникационной среде, которую описывает Фаррадейн, содержит описание, с одной стороны, процессов мышления человека как генератора информации, знания которого и являются первоисточником информации, с другой стороны, человека как получателя информации, которая интерпретируется им в рамках его системы знаний.

Фаррадейн трактует знания как отпечаток процессов понимания и осознания, происходящих в памяти человека, как нечто, доступное лишь в пределах памяти человека. При этом он отмечает, что сами процессы понимания и осознания в настоящее время остаются во многом невыясненными.

Информация трактуется им как некоторые сущности плана выражения, представляющие знания в процессах социальных коммуникаций, например, это могут быть слова, словосочетания и предложения текстов на естественных языках. Чтобы отличать определение информации по Фаррадейну от других трактовок и определений информации в информационной науке, будем при их сопоставлении называть ее «языковой информацией».

О свойствах языковой информации и ее связях со знаниями человека Фаррадейн говорит следующее: «…она [информация] нейтральна в том смысле, что она не должна быть обязательно новой для воспринимающего ее субъекта. Нам известно большое количество практических примеров обработки информации в системах поиска и хранения, но ее отношение к знаниям не менее важно для развития информационной науки, чем обработка самой информации» (35, с. 77). Приведенные положения из работы Фаррадейна позволяют сделать вывод о том, что он придерживается первого варианта трактовки термина «информация», которая является непосредственным результатом процесса представления знаний человека в виде отчужденных и сенсорно воспринимаемых форм. Трактовка информации по Фаррадейну принципиально отличается от трактовки Брукса (29).

Информация по Бруксу – это только «кванты» знаний человека, которые он называет приращением знаний. Ю.А. Шрейдер выразил особенность этого варианта трактовки следующим образом:

«Фактически на позиции признания тождества информации и знания (выделено мной. – И.З.) как сущностей стоит Б. Брукс, построивший основания традиционной информатики (информационной науки) на базе концепции "третьего мира"6. Он определяет информацию как приращение знаний (выделено мной. – И.З.)» (27, с. 49).

В этой же работе Ю.А. Шрейдер писал о том, как исторически сформировалась концепция А.И. Михайлова, А.И. Черного и Р.С. Гиляревского об информатике как науке, изучающей информацию, связанную со знаниями, а не с управляющими сигналами (19). Отметим, что для Ю.А. Шрейдера «… информация есть превращенная форма знания, в которой это знание представлено. … Тождественность информации и знания при этом исключается (выделено мной. – И.З.), но информация как превращенная форма знания сохраняет следы своего происхождения» (27, с. 50).

Бертрам Брукс предложил свое понимание информации в контексте описания оснований информационной науки. По его мнению, понятия В этой цитате из работы Ю.А. Шрейдера речь идет о мирах К. Поппера. Отношение "третьего мира" с другими мирами К. Поппера иллюстрирует рис. 3.

информации и знаний, безусловно, являются главными в информационной науке. В попытке сформулировать основания информационной науки Брукс обратился к трудам по философии. Наиболее значимой для него работой была книга Карла Поппера «Объективное знание» (21).

Объясняя роль теории объективных знаний для оснований информационной науки, Брукс использует так называемые миры К. Поппера (50, с. 108) (см. рис. 3):

мир физических объектов (материальных денотатов) и их физических состояний (мир 1);

мир состояний субъективного (личностного) сознания, и, возможно, предрасположений (эмоций) (мир 2);

мир объективного (конвенционального) содержания мышления, прежде всего признанных научных идей (мир 3).

В концепции трех миров К. Поппера сопоставляется мир субъективных (личностных) человеческих знаний и мир объективных знаний. Необходимо отметить, что, определяя мир 3, Поппер объективными называет те знания, для которых существуют общепринятые формы их представления (например, тексты на естественных языках).

Брукс считает, что практическая деятельность библиотекарей и информационных ученых (information scientists) складывается из собирания и хранения форм представления знаний мира 3. При этом актуальной теоретической проблемой [информационной науки] является изучение взаимодействий между мирами 2 и 3. Для того, чтобы объективировать наши индивидуальные мысли и знания, нам необходимо общепринятым образом выразить их в мире 3 (29, с. 129).

Физический Субъективные мир знания Объективные знания P p ис. Рис. 3. Три мира К. Поппера По мнению Брукса, в чем действительно нуждается информационная наука как в основе, так это в теории объективных (конвенциональных) знаний, нежели в теории субъективных (личностных) знаний (29, с. 127).

Отметим, что результаты экспериментов по компьютерному моделированию процессов формирования новых концептов позволяют предположить, что построение основ информационно-компьютерной науки нуждается как в теории объективных (конвенциональных) знаний, так и в теории субъективных (личностных) знаний (47).

Основополагающими понятиями Брукс считает информацию и знания.

Для него вопрос их соотношения является центральным при обсуждении оснований информационной науки. Брукс рассматривает знания как структуру взаимосвязанных понятий, а информацию – как структурный элемент знаний, то есть относит информацию к ментальной сфере. При этом знания могут быть объективными (мир 3) или субъективными (мир 2) (29, с. 131).

Брукс предлагает выражать соотношение между информацией и знанием в виде следующей последовательности символов K[S]+I=K[S+S], которую он назвал «фундаментальным уравнением» информационной науки.

Эту последовательность символов он интерпретирует следующим образом:

структура знаний K[S] под влиянием информации I меняется на новую модифицированную структуру K[S+S], где S обозначает результат этой модификации. Описывая соотношение между информацией и знанием, Брукс говорит следующее: «Фундаментальное уравнение информационной науки также подчеркивает, что определенная таким образом информация не является идентичной сенсорным данным-ощущениям. /…/ Информация может зависеть от результатов наблюдений, но сенсорные данные, полученные таким образом, должны быть интерпретированы когнитивными структурами знаний человека, чтобы стать информацией. /…/ Уравнение также имеет своей целью вывести тот факт, что рост знаний не просто увеличивается. Поглощение информации структурой знаний может повлечь за собой не просто добавление, а такое уточнение структуры, как изменение отношений между понятиями. В науке прирост информации иногда приводил к реструктурированию знаний» (29).

Предлагаемое Бруксом определение информации будем называть «ментальной информацией», так как определяемая им сущность относится к ментальной сфере. Употребление в докладе словосочетания «ментальная информация» будет предполагать, что речь идет об основаниях информационной науки и терминах, предложенных Бруксом.

Подведем итоги анализа терминов, включая позиционирование языковой информацией Фаррадейна и ментальной информацией Брукса относительно ментальной и социально-коммуникационной сред.

Во-первых, процесс передачи языковой информации в социально коммуникационной среде, который описывает Фаррадейн, рассматривается им в контексте ментальных креативных процессов у того человека, который является генератором языковой информации, и ментальных познавательных процессов у того человека, который является получателем языковой информации. Фаррадейн использует слова «знания» и «информация», относя их, соответственно, к ментальной и социально-коммуникационной средам.

Во-вторых, Брукс рассматривает знания как структурированную систему взаимосвязанных понятий, не указывая в явном виде ту знаковую систему, с помощью которой были вычленены эти понятия, а информацию – как элемент этой системы, то есть он использует слова «знания» и «информацию» в пределах только одной - ментальной среды.

В-третьих, термины «знания», «концепты» и «информация» определены таким образом, чтобы можно было фиксировать промежуточные результаты первого этапа всего процесса представления знаний в социально коммуникационной среде, для обозначения которых в докладе используется исчисляемое существительное «концепты». Окончательным результатом представления знания человека является языковая информация по Фаррадейну, для обозначения которой в докладе используется термин «знаковая информация». Ментальную информацию по Бруксу можно было бы назвать концептами, если задать в явном виде знаковую систему, с помощью которой ментальная информация вычленяется из знаний человека.

Отношения принадлежности рассмотренных терминов двум средам сведены в табл. 1. В эту же таблицу добавлены термины «знания» и «информация» в трактовке Ю.А. Шрейдера. Отметим, что при их описании Ю.А. Шрейдер образно говорил о пропасти, разделяющей информацию и знания как сущности разной природы (выделено мной – И.З.) (27, с. 51).

Названия Фаррадейн Брукс Шрейдер Доклад сред Ментальная среда, Знания Знания в том числе человека, Знания Знания человека, планы содержания и менталь человека человека результаты членения ная инфор- концепты знаний человека мация Социально Инфор коммуникационная среда, мация, в том числе планы Языковая Сенсорные Инфор- знаковая выражения естественных информация данные мация языков и результаты информация наблюдения Данные материальных объектов и явлений Табл. 1. Принадлежность терминов ментальной и социально-коммуникационной средам в информационной и информационно-компьютерной науках Для учета сенсорных данных как результатов наблюдений, о которых говорит Брукс, в первый столбец табл. 1 включены результаты наблюдений материальных объектов и явлений. Термин «данные» во многом аналогичен сенсорным данным Брукса.

Из табл. 1 следует, что содержание определенных в докладе терминов «знания», «концепты», «информация», «знаковая информация» и «данные» во многом соответствуют основаниям информационной науки с точностью до лексики: языковая информация по Фаррадейну в докладе обозначена термином «знаковая информация», а ментальная информация по Бруксу может быть обозначена исчисляемым существительным «концепты», если задана знаковая система, с помощью которой ментальная информация вычленяется из знаний человека.

Термин «концепты» удобно использовать при описании промежуточных результатов процесса представления знаний, то есть результатов этапа членения знаний на концепты на основе некоторого естественного языка или знаковой системы. Эта таблица наглядно иллюстрирует принадлежность терминов «знания» и «концепты», «знаковая информация» и «данные»

ментальной и социально-коммуникационной средам, соответственно.

В табл. 1 не включена цифровая сфера и соответствующие ей термины «цифровые данные», «коды» и «цифровая информация», определение которых дано в докладе.

Подведем итоги построения системы терминов информационно компьютерной науки, перечислив их кратко с небольшими дополнениями (см.

рис. 4):

– ментальные знания – результаты познавательной и креативной деятельности человека, носителем которых может быть только человек и в которых могут быть выделены отдельные «кванты» знаний (ментальная среда);

– концепты – элементарные единицы или сочетания элементарных единиц плана содержания, выраженные в рамках некоторого естественного языка (в общем случае, в рамках той или иной знаковой системы);

концепты делятся на личностные, согласованные группой экспертов и конвенциональные концепты (ментальная среда);

– ментальные образы – структурные единицы невыраженных знаний человека, соответствующие сенсорно воспринимаемым данным и не являющиеся концептами (ментальная среда);

– информация – авторские, коллективные или общепринятые формы эксплицитного (явного) и отчужденного от человека представления его знаний, предназначенные для передачи, непосредственного сенсорного восприятия и понимания их другими людьми (социально-коммуникационная среда);

1) Ментальные 12) Ментальные Ментальная среда знания, 2) концепты, образы сенсорно 3) личностные, воспринимаемых 4) согласованные и 5) конвенциональные данных концепты 6) Информация, 11) Данные как формы Социально 7) знаковая представления коммуника информация и 8) цифровых данных в ционная среда информационные соц.-комм. среде объекты 9) Три категории 10) Цифровые Цифровая среда кодов (концептов, их данные как нулевая форм и денотатов) категория кодов ис. Рис. 4. Три среды и их термины – знаковая информация – результат процесса представления концептов человеком в плане выражения некоторой знаковой системы в любой отчужденной форме, которая является сенсорно воспринимаемой другими участниками коммуникаций и содержательно интерпретируется ими в рамках этой знаковой системы (социально-коммуникационная среда);

– коды – компьютерные эквиваленты двоичных цифр (или их последовательностей), которые могут представлять собой в цифровой среде намагниченность или ее отсутствие, наличие электрического тока или его отсутствие, способность к отражению света или ее отсутствие;

в интересах описания моделей выделяются три категории кодов: коды первой категории для концептов, коды второй категории для информационных объектов и коды третьей категории для денотатов (цифровая электронная среда);

– цифровые данные – компьютерные эквиваленты двоичных цифр, которые не соотнесены в явном виде с тремя категориями кодов (цифровая электронная среда);

– данные – формы представления цифровых данных в социально коммуникационной среде (социально-коммуникационная среда).

Рис. 4 содержит 12 терминов информационно-компьютерной науки, пронумерованных против часовой стрелки. Эти термины распределены по шести прямоугольникам. В качестве критериев для их распределения использовались средовой принцип, предложенный К.К Колиным, определение сферы незнания, предложенное В.Л. Макаровым и Г.Б. Клейнером, разграничение между знаковой информации и данными по источнику их генерации, предложенное Ю.И. Шемакиным, и разграничение личностных, коллективных и общепринятых знаний, предложенное Вежбицки и Накамори.

Заключение Обзор многолетней истории проблематики интеграции информационной и компьютерной наук позволяет сделать следующие выводы.

Во-первых, приведенные положения из работ Горна и Шрейдера являются ключевыми для описания научной парадигмы информационно компьютерной науки, но не включают ряда необходимых ее составляющих, в том числе философские основания, аксиоматику, классификацию объектов, процессов и явлений этой области знаний, а также систему терминов.

Во-вторых, процессы понимания, осознания и экспликации знаний, в настоящее время по-прежнему остаются во многом невыясненными. В информационной науке они исследуются как когнитивные и креативные процессы, с которыми связаны процессы генерации информации, обеспечения социальных коммуникаций и понимания информации. В этой науке знания человека (в том числе ментальная информация Брукса) и языковая информация Фаррадейна соотносятся между собой как сущности разной природы.

В-третьих, в компьютерной науке в качестве базовых понятий используются, как правило, «символы абстрактного алфавита», в явном виде не соотнесенные со знаниями человека и ментальной информацией Брукса, а также с языковой информацией Фаррадейна. Например, в классической работе Тьюринга слова «знания» и «информация» не используются, а рассматриваются лишь линейные символьные выражения. Однако в этой работе отмечается, что в одной ячейке может располагаться линейная последовательность символов, трактуемая как единый сложный символ, и проводится аналогия между сложными символами и словами европейский языков (50).

Таким образом, имеется непустое пересечение множества символьных выражений «языка» компьютерной науки и множества слов естественных языков информационной науки, являющихся знаковой информацией, то есть знаковыми формами представления знаний и главной объектами социокультурных коммуникаций. Это пересечение объектов их предметных областей (то есть, пересечение объектов исследования в компьютерной и информационной науках) относится одновременно к предметным областям обеих наук. Однако эти объекты в компьютерной науке трактуются и обрабатываются как абстрактное множество символьных выражений, а в информационной науке эти же объекты могут трактоваться и обрабатываться как множества конкретных слов естественных языков с их собственными планами выражения и содержания.

Поэтому необходима новая научная парадигма информационно компьютерной науки, которая учитывает объективное существование этого пересечения и при этом обеспечивает:

интеграцию непересекающихся зон предметных областей компьютерной и информационной наук, а также тех направлений исследований, относящихся к когнитивным наукам, которые необходимы для создания новых поколений ИКТ;

создание фундаментальных основ разработки новых поколений ИКТ и конвергентных технологий, предназначенных для исследование процессов, разработка методов и моделей формирования новых и развития существующих систем знаний;



Pages:   || 2 |
 

Похожие работы:


 
2013 www.netess.ru - «Бесплатная библиотека авторефератов кандидатских и докторских диссертаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.