Về vai trò của thư viện đại học trong bức tranh TDM

Ngày đăng: 25/07/2017

25 năm trước, khi Laurents Sesink từng vẫn còn là sinh viên sử học, luận án của anh về các quan hệ chính trị quốc tế đã gồm nhiều đánh dấu các nhãn và các bài đọc. Khi đó anh đã nghĩ "Phải có cách tốt hơn để làm điều này", vì thế anh đã xây dựng cơ sở dữ liệu và bắt đầu công việc về thông tin và số hóa. Bây giờ anh là người đứng đầu của Trung tâm Hàn lâm Số (Centre for Digital Scholarship) ở thư viện Đại học Leiden. Trung tâm đã được khởi xướng vào tháng 7/2016, và họ hiện đang chỉ ra cách tốt nhất để hỗ trợ cho nghiên cứu.

Trung tâm Hàn lâm Số ở Đại học Leiden vẫn còn quá mới. Nó đã được bắt đầu như thế nào?

Nó đã được ban lãnh đạo trường đại học khởi xướng, vì họ muốn các nhà khoa học có khả năng sử dụng các công cụ và các công nghệ mới nhanh hơn. Đã có rồi nhiều hoạt động liên tục trong lĩnh vực quản lý dữ liệu và truy cập mở ở đại học này. Điều đó giải thích vì sao tầm nhìn là phải có cửa hàng một cửa duy nhất (one-stop-shop), nó làm việc cùng và tham chiếu tới sự tinh thông đang có lan truyền khắp đại học. Trung tâm rõ ràng không ngụ ý sẽ nắm lấy sự tinh thông này, mà là để kết nối nó tốt hơn.

Trung tâm Hàn lâm Số thực sự làm gì?

Chúng tôi làm các việc khác nhau. Trước hết, chúng tôi hỗ trợ các nhà nghiên cứu để làm cho các xuất bản phẩm của họ là truy cập mở và tìm kiếm các xuất bản phẩm truy cập mở. Thứ 2, chúng tôi hỗ trợ họ bằng sự quản lý dữ liệu nghiên cứu, điều này cũng bao gồm sự bảo tồn dữ liệu. Nhưng điều mới mẻ và thực sự thú vị mà chúng tôi đang làm, là chúng tôi hỗ trợ các nhà nghiên cứu bằng khoa học dữ liệu. Việc khai thác văn bản và dữ liệu cũng là một phần của gói này.

Các thư viện đại học khác cũng có tiếp cận tương tự chứ?

Chủ yếu ở Mỹ và Anh, tôi nghĩ thế. Tại Hà Lan chúng tôi là đầu tiên. Ở hầu hết các thư viện đại học ở Hà Lan, các hoạt động đó là một phần của ‘hỗ trợ nghiên cứu', nên nó đang diễn ra. Nhưng ở Leiden chúng tôi chọn phân đoạn nó, và phải có các nhân viên chuyên tâm.

Vì sao việc hỗ trợ cho các nhà nghiên cứu bằng khoa học dữ liệu lại rất thú vị?

Vì nó là mới và vì chúng tôi vẫn còn chỉ ra cách để tổ chức nó, những gì phải tập trung vào. Đó là những gì làm cho nó trở nên thú vị. Có hàng ngàn nhà nghiên cứu ở đại học này, và chúng tôi chỉ có 6 FTE ở trung tâm của chúng tôi. Chúng tôi hy vọng mở rộng thành 12 FTE. Nhưng thậm chí như vậy, chúng tôi vẫn phải tiến hành lựa chọn.

Dạng các lựa chọn nào vậy?

Chúng tôi không thể chỉ hỗ trợ các nhà nghiên cứu và phân phối các kết quả, chúng tôi cũng phải huấn luyện cho họ để tiến hành, ví dụ, việc khai thác văn bản và dữ liệu cho bản thân họ. Chúng tôi đang thiết lập việc này qua Dạy nghề Thư viện - Library Carpentry (trang chuyên đào tạo các kỹ năng phần mềm cho những người chuyên nghiệp về thư viện), để chắc chắn rằng các thủ thư của riêng chúng tôi trở thành các đối tác hội thoại tốt khi nói về khoa học dữ liệu. Hiện tại chúng tôi đang bắt đầu với Dạy nghề Dữ liệu - Data Carpentry, cùng với Trung tâm Công nghệ Hà Lan về Khoa học Đời sống (Dutch Tech Centre for Life Sciences). Các thủ thư hàn lâm số của riêng chúng tôi cũng đang tham gia khóa huấn luyện, để có khả năng huấn luyện những người khác.

Ông đã nói với tôi trước đó, ông đang làm việc chặt chẽ cùng với các nhà khoa học để tìm ra những hỗ trợ nào họ cần. Ông có thể nói một chút về điều này?

Chúng tôi sử dụng phương pháp luận của dự án Agile, với các yếu tố scrum. Ví dụ: một trong các nhà nghiên cứu chúng tôi cùng làm việc đang nghiên cứu văn học Trung Quốc - Malaysia (Sino-Malaysian literature). Chúng tôi chia nhỏ nghiên cứu đó thành 2 bước lớn. Trước tiên chúng tôi xem xét các dữ liệu, những gì cần thiết để biến chúng thành FAIR có được chăng? Ở bước thứ 2 chúng tôi đã xem xét tính sẵn sàng của dữ liệu. Các cuốn sách, ví dụ, vẫn nên được công nhận như những cuốn sách. Rồi chúng tôi đi tới các phân tích: những phân tích nào nhà nghiên cứu này có thể làm, các công cụ nào có sẵn?

Nghe có vẻ thú vị khi làm việc này chặt chẽ với các nhà nghiên cứu!

Đúng vậy, nhưng đó cũng là công việc rất nặng nhọc. Vì thế chúng tôi đã học được là chúng tôi cần một tiếp cận khác, đặc biệt khi nói về khai thác văn bản và dữ liệu - TDM (Text and Data Mining). Trong tương lai, chúng tôi sẽ chia sự hỗ trợ của chúng tôi thành 3 mức:

  1. Khóa học giới thiệu về khai thác văn bản và dữ liệu, với các ví dụ. Chúng tôi cũng phải xem liệu chúng tôi có thể kết nối tới thứ gì đó đang tồn tại rồi hay không.
  2. Tư vấn cho các nhà nghiên cứu, những người có sự hiểu biết rồi về TDM về các công cụ có sẵn, và cách họ có thể tùy biến chúng cho các nhu cầu của họ.
  3. Việc hỗ trợ cho một nhà nghiên cứu biết rồi chính xác những gì anh/chị ta cần, nhưng các công cụ đang tồn tại còn chưa đủ, nên họ cần nhiều hỗ trợ hơn. Nhưng chúng tôi chũng sẽ chỉ có khả năng chào điều này cho số lượng giới hạn các nhà nghiên cứu.

Chúng tôi đã học được nhiều từ làm việc với các nhà nghiên cứu, rằng chúng tôi có thể đã học được trong khi ngồi ở các bàn làm việc của riêng chúng tôi. Và họ cũng học được từ chúng tôi, vì thế đó là sự tương tác vui vẻ.

Ông chủ yếu làm việc với các nhà nghiên cứu nhân văn à?

Nếu nói về việc khai thác văn bản và dữ liệu: đúng. Vâng, nhân văn, luật, một chút khoa học xã hội. Các ngành nghề khác nhau đi tới chúng tôi với các câu hỏi khác nhau. Các nhà khoa học đời sống quen thuộc hơn trong việc tự họ phát triển các công cụ. Họ chủ yếu tìm kiếm sự hỗ trợ với truy cập mở và quản lý dữ liệu nghiên cứu.

Theo ông, đâu là thách thức lớn nhất cho việc khai thác văn bản và dữ liệu?

Để giữ cho tổng quan công việc được hoàn thành, thì các công nghệ, các kết quả, các công cụ phần mềm tốt nhất… Có rồi nhiều điều mới luôn xuất hiện. Là thách thức để nêu ra các công việc nào là tốt nhất trong từng trường hợp. Và sau đó: nếu bạn muốn TDM được triển khai rộng rãi hơn, tri thức phải được cải thiện. Ở vài thời điểm, từng người nên có sự tinh thông cơ bản, và sau đó chúng tôi có thể bắt đầu huấn luyện ở mức chuyên gia.

Ông nghĩ gì về vai trò của các thư viện trong bức tranh TDM?

Hiện tại chúng tôi hầu hết làm việc theo yêu cầu. Chúng tôi không nên chào những điều không có nhu cầu. Nhu cầu này có thể tới từ chính sách, hoặc trực tiếp từ các nhà khoa học. Nhưng tôi nghĩ cũng là quan trọng để nhìn trước, ví dụ, để thấy các công nghệ nào đang được phát triển rồi, và các xu thế đang diễn ra. Điều đó sẽ làm cho dễ dàng hơn để chuẩn bị cho sự chuyển đổi quá độ. Sẽ có những vấp váp trên con đường đó, và dễ dàng hơn nhiều để làm việc với họ nếu bạn được chuẩn bị tốt hơn. Các thư viện theo truyền thống được tập trung nhiều hơn vào phần hành chính của mọi điều, nhưng tôi nghĩ chúng tôi có thể cũng thích nghi được nhiều hơn mà không đánh mất đi độ tin cậy, tất nhiên rồi. Ở đây chúng tôi có thể học được từ các viện nghiên cứu.

Bài báo này ban đầu được đăng trên website của FutureTDM và OpenMinTeD, 2 dự án mà LIBER là đối tác.

                       Martine Oudenhoven, LIBER's Community Engagement Officer.

                      Theo: http://libereurope.eu/blog/2017/06/02/role-university-library-tdm-landscape/

                       Lê Trung Nghĩa dịch

 

 

CÁC BÀI VIẾT CÙNG CHUYÊN MỤC