4709

Вивчення бібліотеки прикладних програм nltk, для опрацювання текстів природною мовою

Лабораторная работа

Информатика, кибернетика и программирование

Мета роботи: вивчення основ програмування на мові Python. Короткі теоретичні відомості Оператор for в Python трохи відрізняється від аналогічного оператора в C або Pascal. Замість незмінного проходження по арифметичній прогресії з чисел (як в Pascal...

Украинкский

2012-11-25

21.61 KB

11 чел.

Мета роботи: вивчення основ програмування на мові Python.

Короткі теоретичні відомості

Оператор for в Python трохи відрізняється від аналогічного оператора в C або Pascal. Замість незмінного проходження по арифметичній прогресії з чисел (як в Pascal) або надання користувачеві можливості вказати крок ітерації та умову останову (як в С), оператор for в Python проходить по всіх елементах будь-якої послідовності (списку або стрічки) в тому порядку, в якому вони в ній розташовуються.

У мовна інструкція (інструкція розгалуження)— це розвилка на шляху виконання програми. Програма може піти по одному шляху, а може і по іншому. Шлях вибирається в залежності від значення змінних в момент перевірки умови.

У циклі з умовою while цикл виконується, поки істинною є його умова. Тому цей цикл також іноді називають циклом "поки". Часто цикл while використовується, коли неможливо заздалегідь передбачити, скільки разів необхідно виконати тіло циклу. У повсякденному житті цикл while можна зустріти в алгоритмах, ніби "Поки в межах видимості є машини, стояти на місці" або "Поки в ящику є деталі, дістати деталь з ящика".

Тексти програм на мові Python.

  1. Створіть змінну sentence і присвойте їй значення ‘she sells sea shells by the sea shore’  та напишіть фрагмент програми, яка генерує нову стрічку додаючи ‘like’ перед кожним зі слів , яке починається з ‘se’.

[]

>>> sentence

'she sells sea shells by the sea shore'

>>> words=sentence.split()

>>> words

['she', 'sells', 'sea', 'shells', 'by', 'the', 'sea', 'shore']

>>> for word in words:

if word.startswith('se'):

 print 'like '+word ,

else:

 print word ,

 

she like sells like sea shells by the like sea shore

  1. Перегляньте результати виконання умовних виразів: ’row’ in ’brown’ та ’row’ in [’ brown’, ’cow’]. Напишіть програму для перевірки наявності в стрічці sent=’ ’colorless green ideas sleep furiously’ окремих слів та підстрічок

>>> 'row' in 'brown'

True

>>> 'row' in [' brown', 'cow']

False

>>> sent=' ’colorless green ideas sleep furiously'

>>> 'ee' in sent

True

>>> 'ing' in sent

False

>>> 'sleep' in sent

True

>>> 'ideas sleep' in sent

True

>>> 'furiosly' in sent

False

8. Виконати наступні приклади і пояснити різницю між ними

w.isupper()  

not w.islower()

>>> words

['she', 'sells', 'sea', 'shells', 'by', 'the', 'sea', 'shore']

>>> w.isupper()

False

>>> w.islower()

True

>>> not word.islower()

False

  1. Використайте вираз sum([len(w) for w in text1]) для знаходження середньої довжини слів в тексті.

  1. Перевірте виконання виразу set(sent3) < set(text1). Змініть аргументи функції. Результати поясніть.

  1. В стрічці "Love me tender, love me sweet, never let me go." Написати програму для знаходження: Розділові знаки.

>>>song="Love me tender, love me sweet, never let me go."

>>> song

'Love me tender, love me sweet, never let me go.'

>>> ([word for word in song if '.' in word or ',' in word])

[',', ',', '.']

Висновок: на цій лабораторній роботі я ознайомилася з основами програмування на мові Python.


 

А также другие работы, которые могут Вас заинтересовать

28584. Генерация случайных чисел с использованием аппаратных ДСЧ 12.16 KB
  Практически интересным является вопрос о создании аппаратных ДСЧ генерирующих 01 последовательность как можно более близкую к последовательности получаемой по равновероятной биномиальной схеме. Проблема с использованием аппаратных ДСЧ заключается в необходимости наличия дополнительного изделия а это зачастую может быть трудно реализуемо. В тех случаях когда криптографические преобразования реализуются аппаратно эта проблема разрешима сегодня аппаратные ДСЧ реализованы в изделиях серии ГРИМ и КРИПТОН при этом правда ДСЧ последнего не...
28585. Классификация имущества предприятия по видам 34 KB
  К ним относятся основные средства капитальные и другие финансовые вложения нематериальные активы. Основные средства – это часть средств производства целиком и полностью участвующие в хозяйственной деятельности предприятий в течение длительного времени не меняющие своей натуральной формы и переносящие свою стоимость на продукт постепенно по мере износа. Практически к основным средствам относя средства со сроком полезного использования больше 12 месяцев. Оборотные средства активы – вложения финансовых ресурсов в объекты...
28586. Классификация системы внутреннего контроля 28 KB
  Также различают внутренний контроль в зависимости от применяемых методов и приемов контроля общие методы контроля индукция дедукция анализ синтез обобщение и другие самостоятельно разработанные методы замеры взвешивание пересчет инвентаризация наблюдение экспертиза сверка обратная калькуляция логическая и экономическая проверка тестирование анкетирование опрос и т. Одна из наиболее развитых форм внутреннего контроля внутренний аудит. Организация внутреннего контроля в форме внутреннего аудита присуща крупным и некоторым...
28587. Классификация имущества предприятия по источникам образования 30 KB
  Основной собственный источник хозяйственных средств предприятия – уставный капитал. Его первоначальная величина фиксируется в уставе предприятия без фиксирования в уставе документ фактически не имеет смысла. Направления и величина уставного капитала определяются собственником предприятия.
28588. Кодекс профессиональной этики аудиторов 29 KB
  Кодекс профессиональной этики аудитора устанавливает нормы поведения аудиторов определяет основополагающие принципы которые должны соблюдаться им в процессе выполнения своих профессиональных функций. Для разработки профессиональной этики используются положения общей этики. Выделяют международный национальный и внутренний кодексы профессиональной этики аудиторов.
28589. Кодекс этики профессиональных бухгалтеров 48 KB
  На базе международного кодекса ИПБ России разработал в 1999г. Кодекс этики члена ИПБ России. Кодекс этики члена ИПБ России был утвержден в 1999г. в качестве документа общественного регулирования саморегулирования деятельности членов ИПБ.
28590. Инвентаризация – метод бухгалтерского учёта 32 KB
  Принципы инвентаризации: внезапность; сопоставимость единиц измерения; плановость; объективность; юридическая правомочность результатов; непрерывность; полнота охвата объектов; воспитательное воздействие и материальная ответственность; оперативность и экономичность; гласность. В зависимости от времени проведения и роли в хозяйственном процессе различают плановые и внеплановые инвентаризации. Плановые инвентаризации проводят периодически согласно плана графика в заранее намеченные сроки. Внеплановые инвентаризации проводятся по...
28591. Институт профессиональных аудиторов 27.5 KB
  Институт действует на основе следующих принципов: добровольное участие в Институте и выход из Института его членов; равенство всех членов Института; принятие решений органами Института с учетом интересов всех членов Института; саморегулирование; внутренний контроль; осуществление членами Института профессиональной деятельности в соответствии с принятыми Институтом правилами стандартами и иными формами регулирования профессиональной деятельности членов Института; соблюдение членами Института установленных Институтом этических норм; создание...
28592. Институт профессиональных бухгалтеров и аудиторов России 29 KB
  Институт профессиональных бухгалтеров и аудиторов России ИПБ России самая крупная саморегулируемая некоммерческая организация в России. С 2001 года ИПБ России Действительный член Международной федерации бухгалтеров IFAC с 2002 года аккредитован как профессиональное аудиторское объединение при Министерстве финансов Российской Федерации. Членами ИПБ России являются аттестованные профессиональные бухгалтеры и аудиторы.