
SO SÁNH CÁC VĂN BẢN TIẾNG VIỆT THEO ĐỘ KHÓ
Author(s) -
Nguyễn Thanh Sơn,
Hồ Viết Hoàng,
Nguyễn Thị Như Điệp,
Đinh Điền,
Lương An Vinh
Publication year - 2021
Publication title -
xã hội và nhân văn
Language(s) - Vietnamese
Resource type - Journals
eISSN - 2615-9724
pISSN - 2588-1213
DOI - 10.26459/hueunijssh.v130i6a.5744
Subject(s) - chemistry , stereochemistry
Độ khó của văn bản là chỉ số xác định văn bản dễ hay khó đọc ở mức nào. Độ khó của văn bản đóng vai trò vô cùng quan trọng trong việc soạn thảo, phát hành và lựa chọn sách, đặc biệt là trong lĩnh vực giáo dục. Nghiên cứu về độ khó của văn bản đã được quan tâm từ lâu nhưng chủ yếu là cho tiếng Anh và một số ngôn ngữ phổ biến khác. Trong bài báo này, chúng tôi trình bày một phương pháp so sánh độ khó của các văn bản tiếng Việt với nhau sử dụng bộ phân lớp SVM. Bộ ngữ liệu được sử dụng là các tác phẩm văn học Việt Nam được đánh giá độ khó tương quan với nhau thông qua một số người đọc. Phương pháp này không đòi hỏi quá nhiều chi phí để xây dựng bộ ngữ liệu huấn luyện nhưng cũng đạt được độ chính xác xấp xỉ 80%. Đây cũng là tiền đề cho việc so sánh và lựa chọn các văn bản sao cho phù hợp với trình độ đọc của người đọc.