Please use this identifier to cite or link to this item:
https://digital.lib.ueh.edu.vn/handle/UEH/67086
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Dr. Bùi Thanh Hiếu | en_US |
dc.contributor.author | Nguyễn Ngọc Châu Uyên | en_US |
dc.date.accessioned | 2023-04-04T02:49:00Z | - |
dc.date.available | 2023-04-04T02:49:00Z | - |
dc.date.issued | 2022 | - |
dc.identifier.other | Barcode: 1000015439 | - |
dc.identifier.uri | https://opac.ueh.edu.vn/record=b1034842~S8 | - |
dc.identifier.uri | https://digital.lib.ueh.edu.vn/handle/UEH/67086 | - |
dc.description.abstract | Trong quá trình xuất bản sách, việc phân loại và xác định chủ đề cho một cuốn sách là một vấn đề rất quan trọng và cần thiết. Hiện nay, tại các nhà xuất bản truyền thống việc phân loại chủ đề cho sách thường được thực hiện bằng cách thông qua biên tập viên. Biên tập viên sẽ đọc tóm tắt nội dung của sách rồi dựa trên những từ khóa để xác định chủ đề cho sách. Trong khi đó số lượng sách cần phân loại chủ đề là rất lớn nên việc các biên tập viên phải chia nhau đọc và xác định chủ đề sẽ mất rất nhiều thời gian, công sức. Không những thế, việc xác định chủ đề thông qua biên tập sẽ mang tính chủ quan, khó phân loại chính xác được các chủ đề có nội dung tương đồng. Chính vì vậy, với mục đích giúp cho việc xác định chủ đề sách được nhanh chóng, khách quan và chính xác hơn thì cần một mô hình thu thập, phân tích, rút trích được những đặc trưng của văn bản để từ đó xác định chủ đề cho văn bản. Tóm lại là việc thu thập, phân tích và hiểu những thông tin ẩn chứa trong các dữ liệu tóm tắt một cuốn sách này chính là cách nhanh nhất để tìm ra chủ đề của sách. Trong nghiên cứu này, trước tiên, chúng tôi đã thu thập tập dữ liệu với 16.559 tóm tắt của các cuốn sách bằng tiếng Anh của các nhà xuất bản và 1.932 tóm tắt của sách bằng tiếng Việt. Sau đó, thực nghiệm trên tập dữ liệu này xác định các chủ đề tiềm ẩn bằng cách sử dụng các mô hình chủ đề LSA, LDA. Cuối cùng, chúng ta so sánh các mô hình, chọn mô hình tối ưu, phân tích mức độ xuất hiện của các chủ đề để xác định chủ đề chính của văn bản. Ứng dụng kết quả thực nghiệm từ mô hình sẽ hỗ trợ cho biên tập viên xác định chủ đề của sách được nhanh và đáp ứng độ chính xác cao hơn ngay cả với số lượng dữ liệu lớn. | en_US |
dc.format.medium | 63 tr. | en_US |
dc.language.iso | Vietnamese | en_US |
dc.publisher | Trường Đại học Kinh tế Tp. Hồ Chí Minh | - |
dc.subject | Mô hình hóa chủ đề | en_US |
dc.subject | Topic modeling | en_US |
dc.subject | Khám phá các chủ đề | en_US |
dc.subject | Discovering themes | en_US |
dc.subject | Chủ đề của sách | en_US |
dc.subject | Book themes | en_US |
dc.subject | Nhà xuất bản | en_US |
dc.subject | Publisher | en_US |
dc.title | Ứng dụng mô hình chủ đề trong phân loại sách cho nhà xuất bản | en_US |
dc.type | Master's Theses | en_US |
ueh.speciality | Information Design and Technology (by Coursework) = Công nghệ thiết kế thông tin và truyền thông (hướng ứng dụng) | en_US |
item.languageiso639-1 | Vietnamese | - |
item.cerifentitytype | Publications | - |
item.grantfulltext | reserved | - |
item.openairetype | Master's Theses | - |
item.fulltext | Full texts | - |
item.openairecristype | http://purl.org/coar/resource_type/c_18cf | - |
Appears in Collections: | MASTER'S THESES |
Files in This Item:
File
Description
Size
Format
Google ScholarTM
Check
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.