Можно ли измерить искушение в письме?

На протяжении десятилетий у нас были инструменты для измерения сложности написания, которые все еще сохраняются в некоторых программах для написания текстов как «Анализ текста». Например, оценка Flesch Reading Ease и оценки Flesch-Kincaid учитывают слоги и слова в предложениях. Тем не менее, выигрыш ничего не прозрачный. Чтобы получить оценку Flesch, вы, или, скорее, ваше программное обеспечение, вы полагаетесь на формулу:

206.835- (1.015 x Средняя длина предложения) – (84.6 x Средние слоги на слово).

В качестве альтернативы вы можете использовать более удобный для пользователя Flesch-Kincaid, который коррелирует с оценкой Flesch с оценочным процентом американцев, которые могут понять содержание, измеренное Flesch Reading Ease. Если статья оценивается в диапазоне от 0 до 30, только выпускники университетов могут полностью понять содержание. Напротив, пятый грейдер может понять любой абзац в диапазоне 90-100, приемлемый для более чем 93 процентов американцев. Чем ниже оценка, тем легче чтение. Вы можете попробовать эту формулу для себя. Я запустил « Зеленые яйца» и «Хам» доктора Сьюза по формулам Флеша-Кинкейда и обнаружил, что книга оценивается невероятно -1,3. Эта оценка предполагает, что идеальный читатель « Зеленых яиц» и «Хам» – плод.

Непрозрачные формулы и причудливые результаты в сторону, формулы удобочитаемости показывают что-то ценное о том, как мы измеряем сложность предложений: подсчет покажет вас до сих пор. На сегодняшний день исследования студентов в области начального и второго образования коррелируют с растущей сложностью в письменной форме с длительностью предложений и предложений. Эта корреляция имеет смысл, поскольку более длинные предложения полагаются на фразы и предложения, маркер для команды писателя над структурой предложения. Но подсчет в одиночку проблематичен. Например, подсчет слогов в слове, чтобы определить его трудность, может значительно исказить меры сложности. Даже двусложное слово может сильно варьироваться в требованиях, которые оно предъявляет к пониманию читателя. Рассмотрим праксис и бейсбол , оба слова с двумя слогами. В то время как ваш средний трекер-грейдер может легко читать бейсбол, слово praxis может отправлять даже некоторые кандидаты, скремблирующие свои словари.

Введите Lexile® Framework, имеющееся в продаже программное обеспечение, которое использует длину предложения в сочетании с частотой, с которой читатели обычно сталкиваются с словами. В дополнение к содержанию корпуса более 100 миллионов книг, статей и веб-сайтов по всему миру, Lexile также очень сильно влияет на определение уровня чтения материалов в начальном и среднем образовании. Более того, баллы Lexile появляются рядом с статьями в библиотечных базах данных, предоставляя оценки по всему, начиная от статьи в местной газете или «Нью-Йоркер» до книг. Но исследователи в основном сосредоточились на способности Лексика определять возрастное чтение для учащихся начального и среднего образования. Это упущение побудило аспиранта Саманту Миллер и меня измерить обоснованность Лексики в оценке общей сложности предложений и абзацев в статье, опубликованной в «Международном журнале делового администрирования» .

Мы обнаружили, что Lexile очень сильно коррелировала с тремя надежными мерами текстовой утонченности, которые мы измерили с помощью программного обеспечения, которое измеряет 19 мер сложности структуры предложения. Лексика сильно коррелировала с тремя наиболее надежными мерами сложности предложений: медианной продолжительностью предложений и предложений, а также использованием сложных номиналов или именных фраз. Лексика наиболее сильно коррелировала с использованием комплексного номинального предложения или предложения (p = <0,0001) и со средней длиной оговорок (p = <0,0002) и средней длины предложения (p = 0,0013).

Вынос? Алгоритмы Lexile надежно определяют сложность слов путем сопоставления слов, используемых писателями, против все еще растущего тела в 100 миллионов текстов, что ценно при сочетании с другими мерами для оценки сложности уровня предложения. Результат? Эти загадочные оценки Lexile, возникающие при доступе к статье из базы данных библиотеки, надежно предсказывают сложность содержимого, которое вы собираетесь читать.