Tóm lược
- Yêu cầu kỹ thuật:
- JavaScript ,
- Python ,
- MS SQL ,
- JSON ,
- HTML ,
- CSS ,
- PostgreSQL ,
- Jira ,
- XPath ,
- Selenium ,
- MongoDB ,
- Cassandra ,
- HTTP ,
- NoSQL ,
- NodeJS ,
- Hadoop ,
- Elasticsearch ,
- Apache Spark ,
- Scala ,
- Golang ,
- Trello ,
- Apache Kafka ,
- Scrapy ,
- ClickHouse ,
- HTTPS ,
- BeautifulSoup ,
- Playwright ,
- Puppeteer
Mô tả công việc
Tóm tắt công việc
- Thiết kế và phát triển các bộ thu thập dữ liệu từ website, blog, và RSS feeds.
- Phát triển các script để tự động hóa quá trình thu thập dữ liệu, xử lý các trường hợp trang web động.
- Xử lý và vượt qua các cơ chế chống scraping như CAPTCHA, JavaScript rendering, etc.
- Tích hợp API của các công cụ tìm kiếm và phát triển các robot để tự động thu thập thông tin dựa trên từ khóa tìm kiếm .
- Phát triển chức năng tìm kiếm và thu thập thông tin mục tiêu dựa trên các tiêu chí nhất định
- Range lương (Gross): 18.000.000 – 27.000.000 VNĐ/tháng Thưởng tháng 13 + performance bonus (gói thu nhập từ 14 tháng lương) thưởng lễ Tết, 20/10, 8/3, sinh nhật,…
- Môi trường công nghệ trẻ trung, năng động, có cơ hội học hỏi; làm việc T2-T6 hàng tuần.
- Tham gia đóng BHXH, BHYT, BHTN theo quy định của Luật, Bảo hiểm sức khỏe PTI cho CNBV
- Được hưởng các phúc lợi của công ty như: khám sức khỏe định kỳ hàng năm tại các bệnh viện lớn, team building định kỳ hàng năm, các chế độ phúc lợi khác dành riêng cho CBNV công ty
- Review thu nhập 2 lần/năm.
Yêu cầu công việc
- Kinh nghiệm tối thiểu 2 năm trở lên tại vị trí tương đương.
- Từng làm việc với các hệ thống quản lý cơ sở dữ liệu SQL và NoSQL (như PostgreSQL,MongoDB, Cassandra, ClickHouse, ElasticSearch).
- Thành thạo ít nhất một ngôn ngữ lập trình (Python, JavaScript (Node.js), Go , Scala )
- Hiểu biết về thư viện và công cụ: BeautifulSoup, Scrapy, Selenium, Puppeteer , Playwright, Request…
- Hiểu biết về HTML, CSS, XPath, và JSON để trích xuất dữ liệu.
- Có kiến thức cơ bản về các giao thức mạng như HTTP, HTTPS, và cơ chế hoạt động của web.
- Có khả năng làm việc với các hệ thống dữ liệu lớn và phức tạp, sử dụng các công cụ như Hadoop, Spark, hoặc Kafka.
- Có kinh nghiệm sử dụng các công cụ quản lý dự án như Jira hoặc Trello, Conflurence để theo dõi tiến độ công việc và quản lý nhiệm vụ.
Ngôn ngữ
-
English
Nói: Intermediate - Đọc: Intermediate - Viết: Intermediate
Yêu cầu kỹ thuật
- JavaScript
- Python
- MS SQL
- JSON
- HTML
- CSS
- PostgreSQL
- Jira
- XPath
- Selenium
- MongoDB
- Cassandra
- HTTP
- NoSQL
- NodeJS
- Hadoop
- Elasticsearch
- Apache Spark
- Scala
- Golang
- Trello
- Apache Kafka
- Scrapy
- ClickHouse
- HTTPS
- BeautifulSoup
- Playwright
- Puppeteer
Thông tin doanh nghiệp
NGS is one of the leading technology companies in Vietnam, specializing in providing products and solutions for system integration, telecommunication services, it training and deploying ERP applications.
NGS has cooperated with many manufacturers and suppliers in the fields of information technology, telecommunications, security and defense, providing enterprise resource management software so that we can meet the needs of our customers well. Best . We have close relationships with SAP, Oracle, Giesecke - Devrient, Aqsacom, Certis, Thales, QCC InterScan, Berkeley Varitronics Systems, TCC, Stratech Systems, Westminster ...
With that goal, we are constantly setting up and developing deep and close relationships with leading organizations and corporations in the field of information technology. The continuous expansion of the market over the past years is a testament to our internal strengths and potential for growth.
NGS always put quality products, construction works, projects to the top and give customers the best solution. Therefore, our company has won the attention and trust from major partners and customers nationwide such as Vietnam Ministry of Public Security, Ministry of Defense of Vietnam, Ministry of Finance, Vietnam Oil and Gas Group Male, ...