Язык как способ представления информации: естественные и формальные языки
В процессе передачи, хранения информация представляется в виде символов, жестов, рисунков (пиктограмм), иероглифов, звуков, сигналов и т.д. При получении информации в какой-либо форме человек (живой организм, компьютер) преобразует (анализирует, обрабатывает) ее в понятный для себя вид. Преобразование информации из одной формы в другую называется кодированием. Наиболее частое кодирование информации — это человеческая речь, письменность, то есть язык.
Различают естественные и искусственные (формальные) языки. Естественные языки развивались веками и служат для общения людей между собой. Примеры естественных языков — русский, английский, китайский и т.д. Формальные языки разрабатываются для специальных применений. Примером формальных языков могут служить языки программирования (Лого, Basic, Pascal и т.д.), языки кодирования информации для ее передачи (телеграфная азбука Морзе, язык жестов), хранения (рисунки-пиктограммы) и т. п. Каждый язык имеет свой алфавит.
Информационные процессы
Процессы, связанные с получением, хранением, обработкой и передачей информации.
Информационные процессы характерны не только для живой природы, человека и общества, но и для техники. Человеком разработаны технические устройства, в частности компьютеры, которые специально предназначены для автоматической обработки информации. Создание глобальной компьютерной сети Интернет позволило обеспечить для каждого человека потенциальную возможность быстрого доступа ко всему объему информации, накопленному человечеством за всю его историю.
Хранение информации.
Передача информации.
Обработка информации.
Человеческое мышление можно рассматривать как процесс обработки информации. Человек является носителем очень большого объема информации в виде зрительных образов, знания различных фактов и теорий и т. д. Весь процесс познания является процессом получения и накопления информации. Для обмена информацией между людьми служат языки. Хранение информации осуществляется с помощью книг, а в последнее время все больше посредством электронных носителей.
Человеку почти непрерывно приходится заниматься обработкой информации, например:
Обработка информации подразумевает преобразование ее к виду, отличному от исходной формы или содержания информации. Процесс изменения информации может включать в себя, например, такие действия как численные расчеты, редактирование (упорядочивание, обобщение, систематизацию и т. д.) Результаты обработки информации в дальнейшем используются в тех или иных целях.
2. Определение результата выполнения алгоритма по его блок-схеме, записи на естественном языке или записи на языке программирования.
Воспринимая информацию с помощью органов чувств, человек стремится зафиксировать ее так, чтобы она стала понятной и другим, представляя ее в той или иной форме.
Музыкальную тему композитор может наиграть на пианино, а затем записать с помощью нот. Образы, навеянные все той же мелодией, поэт может воплотить в виде стихотворения, хореограф выразить танцем, а художник — в картине.
Форма представления информации очень важна при ее передаче: если человек плохо слышит, то передавать ему информацию в звуковой форме нельзя; если у собаки слабо развито обоняние, то она не может работать в розыскной службе. В разные времена люди передавали информацию в различной форме с помощью: речи, дыма, барабанного боя, звона колоколов, письма, телеграфа, радио, телефона, факса. Независимо от формы представления и способа передачи информации, она всегда передается с помощью какого-либо языка. На уроках математики вы используете специальный язык, в основе которого — цифры, знаки арифметических действий и отношений. Они составляют алфавит языка математики. На уроках физики при рассмотрении какого-либо физического явления вы используете характерные для данного языка специальные символы, из которых составляете формулы. Формула — это слово на языке физики. На уроках химии вы также используете определенные символы, знаки, объединяя их в «слова» данного языка. Существует язык глухонемых, где символы языка — определенные знаки, выражаемые мимикой лица и движениями рук. Основу любого языка составляет алфавит — набор однозначно определенных знаков (символов), из которых формируется сообщение.Языки делятся на естественные (разговорные) и формальные.Алфавит естественных языков зависит от национальных традиций. Формальные языки встречаются в специальных областях человеческой деятельности (математике, физике, химии и т. д.). В мире насчитывается около 10 000 разных языков, диалектов, наречий. Многие разговорные языки произошли от одного и того же языка. Например, от латинского языка образовались французский, испанский, итальянский и другие языки.
Информация становится понятной, если она выражена языком, на котором говорят те, кому предназначена информация.
В процессе развития человеческого общества люди выработали большое число языков. Примеры языков:
Язык –– это знаковая система, используемая для целей коммуникации и познания. Основой большинства языков является алфавит – набор символов, из которых можно составлять слова и фразы данного языка.
Все языки можно разделить на естественные и искусственные.
Естественными называются “обычные”, “разговорные” языки, которые складываются стихийно и в течение долгого времени. История каждого такого языка неотделима от истории народа, владеющего им. Естественный язык, предназначенный, прежде всего, для повседневного общения, имеет целый ряд своеобразных черт:
Основными функциями естественного языка являются:
Искусственные языки создаются людьми для специальных целей либо для определенных групп людей: язык математики, морской семафор, язык программирования. Характерной особенностью искусственных языков является однозначная определенность их словаря, правил образования выражений и правил придания им значений.
Любой язык –– и естественный и искусственный –– обладает набором определенных правил. Они могут быть явно и строго сформулированными (формализованными), а могут допускать различные варианты их использования.
Формализованный(формальный) язык –– язык, характеризующийся точными правилами построения выражений и их понимания. Он строится в соответствии с четкими правилами, обеспечивая непротиворечивое, точное и компактное отображение свойств и отношений изучаемой предметной области (моделируемых объектов).
В отличие от естественных языков формальным языкам присущи четко сформулированные правила семантической интерпретации и синтаксического преобразования используемых знаков, а также то, что смысл и значение знаков не изменяется в зависимости от каких-либо прагматических обстоятельств (например, от контекста).
Большинство формальных языков (созданных конструкций) строится по следующей схеме. сначала выбираетсяалфавит, или совокупность исходных символов, из которых будут строиться все выражения языка; затем описываетсясинтаксис языка, то есть правила построения осмысленных выражений. Буквами в алфавите формального языка могут быть и буквы алфавитов естественных языков, и скобки, и специальные знаки и т.п. Из букв, по определенным правилам можно составлять слова и выражения. Осмысленные выражения получаются в формальном языке, только если соблюдены определенные в языке правила образования. Для каждого формального языка совокупность этих правил должна быть строго определена и модификация любого из них приводит чаще всего к появлению новой разновидности (диалекта) этого языка.
Формальные языки широко применяются в науке и технике. В процессе научного исследования и практической деятельности формальные языки обычно используются в тесной взаимосвязи с естественным языком, поскольку последний обладает гораздо большими выразительными возможностями. В то же время формальный язык является средством более точного представления знаний, чем естественный язык, а следовательно, средством более точного и объективного обмена информацией между людьми.
Формальные языки часто конструируются на базе языка математики. Веком бурного развития различных формальных языков можно считать XX век.
С точки зрения информатики, среди формальных языков наиболее значительную роль играют формальный язык логики(язык алгебры логики) и языки программирования.
Возникновение языков программирования приходится на начало 50-х годов XX века.
Языков программирования и их диалектов (разновидностей) насчитывается несколько тысяч. Классифицировать их можно по-разному. Некоторые авторы разбивают все многообразие языков программирования на процедурные и декларативные. В процедурных языках преобразование данных задается с помощью описания последовательности действий над ними. В декларативных языках преобразование данных задается посредством описания отношений между самими данными. Согласно другой классификации, языки программирования можно разделить на процедурные, функциональные, логические, объектно-ориентированные. Однако любая классификация несколько условна, поскольку, как правило, большинство языков программирования включает в себя возможности языков разных типов.Особое место среди языков программирования занимают языки, обеспечивающие работу систем управления базами данных (СУБД). Часто в них выделяют две подсистемы: язык описания данных и язык манипулирования
Теория кодирования – это раздел теории информации, связанный с задачами кодирования и декодирования сообщений, поступающих к потребителям и посылаемых из источников информации.
Теория кодирования близка к древнейшему искусству тайнописи – криптографии. Над разработкой различных шифров трудились многие известные ученые: философ Ф. Бэкон, математики Д.Кардано, Д. Валлис. Одновременно с развитием методов шифровки развивались приемы расшифровки, или криптоанализа.
В середине ХIХ в. ситуация изменилась. Изобретение телефона и искрового телеграфа поставило перед учеными и инженерами проблему создания новой теории кодирования. Первой ориентированной на технику системой кодирования оказалась азбука Морзе, в которой принято троичное кодирование (точка, тире, пауза).
Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.
Двоичный алфавит состоит из двух цифр 0 и 1.
Цифровые ЭВМ (персональные компьютеры относятся к классу цифровых) используют двоичное кодирование любой информации. В основном это объясняется тем, что построить техническое устройство, безошибочно различающее 2 разных состояния сигнала, технически оказалось проще, чем то, которое бы безошибочно различало 5 или 10 различных состояний.
К недостаткам двоичного кодирования относят очень длинные записи двоичных кодов, что затрудняет работу с ними.
ДВОИЧНОЕ КОДИРОВАНИЕ СИМВОЛЬНОЙ (ТЕКСТОВОЙ) ИНФОРМАЦИИ
При сравнении символов наиболее важными аспектами являются уникальность кода для каждого символа и длина этого кода, а сам выбор принципа кодирования практически не имеет значения.
Для кодирования текстов используются различные таблицы перекодировки. Важно, чтобы при кодировании и декодировании одного и того же текста использовалась одна и та же таблица.
Наиболее популярные таблицы перекодировки: ДКОИ-8, ASCII, CP1251, Unicode.
Исторически сложилось, что в качестве длины кода для кодирования символов было выбрано 8 бит или 1 байт. Поэтому чаще всего одному символу текста, хранимому в компьютере, соответствует один байт памяти.
Различных комбинаций из 0 и 1 при длине кода 8 бит может быть 28 = 256, поэтому с помощью одной таблицы перекодировки можно закодировать не более 256 символов. При длине кода в 2 байта (16 бит) можно закодировать 65536 символов.
В настоящее время большая часть пользователей при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др.
т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.
Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.
Одному и тому же двоичному коду ставится в соответствие различные символы.
Двоичный код
Десятичный код
КОИ8
СР1251
СР866
Мас
ISO
11000010
194
б
В
—
—
Т
Начиная с 1997 г. последние версии Microsoft Windows&Office поддерживают новую кодировку Unicode, которая на каждый символ отводит по 2 байта, а, поэтому, можно закодировать не 256 символов, а 65536 различных символов.
Для определения числового кода символа в кодировке Windows (СР1251) нужно при помощи мыши или клавиш управления курсором выбрать нужный символ, затем щелкнуть по кнопке Клавиша. После этого на экране появляется диалоговая панель Настройка, в которой в нижнем левом углу содержится десятичный числовой код выбранного символа.
1.1.1. Информация. Язык как способ представления и передачи информации: естественные и формальные языки Информация— одно из основных, фундаментальных понятий мира, наряду с такими основополагающими понятиями науки, как материя и энергия. Понятие «информация» (от лат. informatio — разъяснение, изложение, осведомление; informare — придавать форму) вошло в широкое употребление в середине XX века. Несмотря на всю его важность, строгого определения информации, пригодного для всех областей науки, сегодня не существует. В обыденной жизни под информациейпонимают сведения о предметах, явлениях, фактах, действиях, процессах, передаваемые людьми устным, письменным или другим образом. Иными словами, это сведения об окружающем мире и процессах, протекающих в нем. Сведения о внешнем мире человек воспринимает с помощью органов чувств (зрения, слуха, вкуса, обоняния, осязания). Таким образом, информация— это знания, сведения, которые человек получает из окружающего мира с помощью органов чувств. Такой подход к понятию «информация» можно назвать субъективным. Однако понятие «информация» намного шире обыденного понимания. Так, с позиции кибернетики* информация— это совокупность сигналов, воздействий или сведений, которые система или объект воспринимает извне (входная информация), выдает в окружающую среду (выходная информация) или хранит в себе (внутренняя информация). Такое определение позволяет рассматривать с единой точки зрения самые разные процессы: передачу сообщений по техническим каналам связи, деятельность нервной системы человека и животных, работу вычислительных машин, различные процессы управления и т. д. Для кибернетического подхода важно, что информация используется для активного действия, управления, т. е. в целях сохранения, совершенствования, развития системы. Например, система управления автомобилем реагирует на нажатие педали газа водителем и регулирует подачу топлива в двигатель. Термостат воспринимает изменение температуры в помещении и в соответствии с заданным режимом включает или отключает отопительные приборы. Нейроны человека в случае, например, ожога или укола передают нервные импульсы к мышцам, что вызывает их быстрое сокращение. На основе генетической информации, заложенной в луковице тюльпана, из нее вырастает цветок определенного цвета. В теории информации** под информацией понимается не каждое сообщение, а лишь такое, которое содержит неизвестные для получателя факты и дополняет его представление об объекте или процессе. С точки зрения такого вероятностного подходаинформация— это сведения об объектах и явлениях окружающей среды, которые уменьшают имеющуюся о них степень неопределенности и неполноты знаний. При таком подходе, например, формулировка теоремы Пифагора или название столицы Франции не являются информацией, если эти сведения уже известны получателю. Функциональный подход определяет информациюкак форму отражения и часто связывает ее с живыми системами. Отражение понимается как результат некоторого воздействия. Некоторый объект считается носителем информации о другом объекте (или внешнем мире), если в нем происходят изменения, отражающие воздействия на него этого второго объекта. Например, проводник нагревается и удлиняется, если он включен в электрическую цепь; металлы, находящиеся на воздухе, окисляются. Тем самым эти объекты передают информацию о внешней среде.
* Кибернетика, по определению ее основоположника Норберта Винера, — наука о связи и управлении в машинах и животных, а также в обществе и человеческих существах. ** Теория информации — математическая теория систем связи и передачи информации. Ее создателем, так же как и основоположником цифровой связи, считается Клод Шеннон. Именно он впервые обосновал возможность применения двоичного кода для передачи информации.
Примерами отражения могут служить танец пчел, сообщающих о найденном источнике пищи; распускание почек на растениях при весеннем потеплении; дрожь человека как реакция на холод или рельеф Земли как результат тектонических процессов в ее недрах. В компьютерной обработке данных под информациейпонимают последовательность символьных обозначений (букв, цифр, закодированных графических образов и звуков и т. п.), несущую смысловую нагрузку и представленную в доступном компьютеру виде. Как правило, наиболее часто в информатике используется следующее определение. Информация — это сведения об объектах и явлениях окружающей среды, которые являются объектом хранения, преобразования, передачи и использования. Науку, изучающую структуру и общие свойства информации, а также методы ее представления, накопления, хранения, поиска, обработки, передачи и воспроизведения с помощью технических средств, называют информатикой.
Виды информации
Одно и то же информационное сообщение может быть представлено знаками, записанными на бумаге или высеченными в камне; звуковыми волнами при устном сообщении; нервными импульсами в процессе говорения; электрическими импульсами при телефонной передаче или телевизионном показе и многими другими способами. Таким образом, информация различается по форме представления. Технические системы обрабатывают информацию в сигнальном представлении. Человек воспринимает информацию также в виде знаков и образов. Это могут быть числа, тексты, графическое представление (таблицы, рисунки, чертежи, схемы, фотографии), видеоинформация и др. Информация может быть представлена и звуковыми сигналами (устная речь, музыка), жестами, запахами, вкусами, световыми сигналами, электрическими и нервными импульсами, перепадами давления или температуры и др. Соответственно, и носителями информации могут быть разные объекты. Среди них — материальные предметы (бумага, камень и т. д.); волны различной природы (звуковые, электромагнитные (световые, радиоволны), гравитационные); состояние вещества (давление, концентрация, температура). По способу восприятия человеком различают информацию визуальную (зрительную), аудиальную (звуковую), вкусовую, обонятельную, тактильную. Значительную часть информации человек получает благодаря зрительному восприятию, меньшую — благодаря слуховому, остальные способы получения информации для человека менее важны. Поэтому в целом человек характеризуется аудиовизуальным восприятием информации.
Cвойства информации
Объективность.Информация не зависит от методов ее фиксации, чьего-либо мнения, суждения. Например, сообщение «до озера недалеко» несет субъективную информацию (зависящую от человека), а сообщение «до озера 4 км» — объективную. Объективную информацию можно получить, например, с помощью различных измерительных приборов. Достоверность.Информация соответствует реальности, истинному состоянию. Недостоверной информация может стать в результате неточных измерений, помех либо в случае сознательного искажения. Намеренно искаженная информация называется дезинформацией. Полнота.Информация достаточна для понимания ситуации и принятия решения. Неполная информация может привести к неправильной оценке ситуации и ошибочным решениям. Актуальность.Информация важна, насущна именно в настоящий момент. Ценность (полезность, значимость).Информация значима для решения поставленной задачи. Избыточная, лишняя информация называется шумом. Разница между полезной информацией и шумом условна — в разное время, при разных обстоятельствах и для разных потребителей одна и та же информация может быть ценной или лишней.
Понятность (ясность).Информация выражена способом, доступным получателю, и обеспечивает ясное и однозначное понимание.
Языки представления информации
Информацию можно представлять с помощью знаков. Знаковые системы— это наборы знаков определенного типа. Примерами знаковых систем являются разговорные языки, системы счисления, нотная грамота, математические формулы. Каждая знаковая система строится на основе определенного алфавита— некоторого конечного упорядоченного набора знаков (символов или сигналов). Полное число символов алфавита называют мощностью алфавита. В знаковую систему включаются также и правила выполнения операцийнад знаками алфавита. Язык — определенная знаковая система представления информации. Существуют естественные и формальные языки. К естественным языкамотносятся разговорные языки в устной и письменной форме, язык мимики и жестов и др. Разговорные языки начали формироваться еще в древнейшие времена для обмена информацией между людьми. На сегодняшний день существует несколько тысяч естественных языков — например, русский, английский, арабский, китайский и др. В устной речи в качестве знаков языка используются различные звуки (фонемы). В основе письменной речи лежит алфавит — набор знаков (букв или иероглифов), которые человек различает по их начертанию. Алфавит русского языка называется кириллицей и содержит 33 знака, английский язык использует латиницу и содержит 26 знаков. Из символов алфавита по правилам грамматики составляются слова, а из них по правилам синтаксиса — предложения. Формальные языки— это специальные языки для различных областей человеческой деятельности. Они имеют жестко фиксированный алфавит и строгие правила грамматики и синтаксиса. Примерами формальных языков служат языки программирования, системы счисления, алгебра и другие языки математики, нотная запись, язык дорожных знаков. Например, десятеричная система счисления — это знаковая система, в качестве алфавита которой используются арабские цифры, а выполнение арифметических операций над ними задается строгими правилами. Азбука Морзе представляет собой алфавит из двух знаков (точки и тире) и правила составления сигналов из этих знаков.
1.1.2. Формализация описания реальных объектов и процессов, моделирование объектов и процессов
Модель — искусственно созданный объект, который замещает исследуемый объект и отображает в более простом, уменьшенном виде структуру, свойства, взаимосвязи и отношения между его элементами.
Для каждой модели существует ее прототип, или оригинал— тот объект, который она замещает. Процесс создания модели называется моделированием. В процессе моделирования выделяются главные, наиболее существенные, свойства объекта. Моделирование ставит целью понять сущность объекта, научиться им управлять, прогнозировать его состояние или действия. Моделировать можно существующие предметы, явления, процессы, а также не существующие: объекты, которые планируется разработать, явления, которые могут и не произойти, и т. д. По назначению различают модели научно-технические, исследовательские, обучающие, имитационные и др. Научно-технические моделипозволяют исследовать явления и процессы в лабораторных, а не в реальных условиях. Исследовательские моделидают возможность изучить потенциальные свойства или характеристики сооружений и механизмов до их воплощения в жизнь, чтобы избежать возможных ошибок. Обучающие моделии тренажеры используются для изучения или демонстрации свойств каких-либо объектов, процессов или явлений. Имитационные модели позволяют заменить (сымитировать) исследуемый объект другим со схожими свойствами. Для исследования одного и того же объекта могут использоваться разные модели. Для исследования разных объектов может использоваться одна и та же модель. По способу реализации модели подразделяют на материальные и информационные. Материальные моделиимеют реальное воплощение: макеты, копии, образцы. Информационные моделипредставляют совокупность информации, характеризующей свойства и состояние объекта и его взаимосвязи с внешним миром. Примерами информационных моделей служат качественные описания, схемы и чертежи, таблицы и рисунки, химические формулы и географические карты, диаграммы и планы и т. д.
Этапы разработки формальной информационной модели: 1. Анализ исследуемого объекта и его свойств, выделение существенных свойств с точки зрения моделирования. 2. Выбор формы представления модели. 3. Формализация. 4. Анализ модели на непротиворечивость. 5. Анализ адекватности (соответствия) модели целям и задачам моделирования. Математические модели — информационные модели в виде совокупности математических формул, отражающих взаимозависимости между параметрами объекта.
Дата добавления: 2018-04-05 ; просмотров: 2550 ; Мы поможем в написании вашей работы!