Matryoshka Representation Learning
Paper • 2205.13147 • Published • 27
How to use minhtuan7akp/snowflake-m-v2.0-vietnamese_matryoshka-finetune with sentence-transformers:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("minhtuan7akp/snowflake-m-v2.0-vietnamese_matryoshka-finetune", trust_remote_code=True)
sentences = [
"Sự khác biệt giữa các thời đại trong nghệ thuật trang trí rồng được thể hiện như thế nào qua các thời Hùng Vương, Lý, Trần, Hồ, Lê, Mạc, Nguyễn?",
"Tài liệu tham khảo\r\n323. Nguyễn Quang Ngọc, “Mấy nhận xét về kết cấu kinh tế của \r\nmột số làng thương nghiệp ờ vùng đồng bằng Bắc Bộ thế kỳ \r\nXVIII-XIX”, Tạp chí Nghiên cứu Lịch sứ, số 5 (218), 1984.\r\n324. Nguyễn Quang Ngọc, Phan Đại Doãn, “Mấy ý kiến về hoạt \r\nđộng thương nghiệp ở nông thôn đồng bằng Bắc Bộ thế kỷ \r\nXVIII-XIX (hiện tượng và bản chất)”, Tạp chí Nghiên cứu\r\nLịch sử, số 5 (224), 1985.\r\n325. Nguyễn Quang Ngọc, “Thêm vài ý kiến về Tam Điệp”, Tạp \r\nchí Nghiên cứu Lịch sử, số 1 (244), 1989.\r\n326. Nguyễn Quang Ngọc, về một số làng buôn ở Đồng bàng Bắc \r\nBộ thế kỳ XVIII-XIX, Hội Sừ học Việt Nam, 1993.\r\n327. Nguyễn Quang Ngọc, Vũ Văn Quân, “Tư liệu về nguồn gốc \r\nchức năng và hoạt động cùa đội Hoàng Sa”, Tạp chí Khoa\r\nhọc xã hội, Đại học Quốc gia, t.XIV, số 3, 1998, ư. 10-20.\r\n328. Nguyễn Quang Ngọc, “Bảo vệ chủ quyền ưên Biển Đông: \r\nmột hoạt động nổi bật của vương triều Tây Sơn”, Tạp chí \r\nLịch sử quân sự, số 1, 1999, tr. 15-18.\r\n329. Nguyễn Quang Ngọc (Chủ biên), Tiến trình lịch sứ Việt Nam,\r\nNxb. Giáo dục, Hà Nội, 2001.\r\n330. Nguyền Quân, Phan cẩm Thượng, Mỹ thuật cùa người Việt,\r\nNxb. Mỹ thuật. Hà Nội. 1989.\r\n331. Nguyễn Tài Thư (Chủ biên), Lịch sử tư tưởng Việt Nam, 2\r\ntập, Nxb. Khoa học xã hội, Hà Nội, 1993.\r\n332. Nguyễn Tài Thư, Nho học và Nho học ớ Việt Nam: Một số lý\r\nluận và thực tiễn, Nxb. Khoa học xã hội, Hà Nội, 1997.\r\n333. Nguyễn Tưòmg Phượng, Binh chế Việt Nam qua các thời đại,\r\nNgày Mai, 1950.",
"Ba Thục, Kinh Sở, Ngô Việt…). Kết thúc cuộc \"Hán Sở tranh hùng\", nhà Hán\r\nđã thống nhất đất nước Trung Hoa từ bắc xuống nam (tiền bắc hậu nam) và phát\r\ntriển đất nước theo một trật tự ngược lại: tiền nam hậu bắc\".\r\nCó thể hình dung cơ cấu của văn hóa Trung Hoa như sau: \r\nVĂN HOÁ\r\nTRUNG\r\nHOA\r\n=\r\nVăn hoá lưu vực sông Hoàng Hà\r\n+\r\nVăn hoá nông\r\nnghiệp lúa nước\r\nĐông Nam Á\r\nVăn hoá du\r\nmục Tây Bắc +\r\nVăn hoá nông\r\nnghiệp khối Trung\r\nNguyên\r\nMối liên hệ và sự tác động qua lại giữa văn hóa Việt Nam với Trung Hoa,\r\ngiữa văn hóa phương Bắc cổ đại với văn hóa phương Nam cổ đại (trong đó có\r\nvăn hóa Nam – Á - Bách Việt) có thể trình bày trong bảng 1.5.\r\nVĂN HOÁ\r\nP.BẮC CỔ ĐẠI\r\nVĂN HOÁ PHƯƠNG NAM (= Đ.N.Á cổ đại)\r\nVăn hoá Nam-Á (Bách Việt)\r\nVăn hóa vùng lưu\r\nvực sông Hoàng\r\nHà\r\nVăn hóa vùng lưu\r\nvực sông Dương\r\nTử\r\nVăn hóa vùng lưu\r\nvực s. Hồng, s.\r\nMã\r\nVăn hóa miền\r\nTrung và đồng\r\nbằng s. Mê Kông\r\nVĂN HOÁ TRUNG HOA VĂN HOÁ VIỆT NAM\r\nBảng 1.5: Quan hệ cội nguồn giữa văn hóa Việt Nam và Trung Hoa\r\nBài 3: TIẾN TRÌNH VĂN HÓA VIỆT NAM\r\nTiến trình văn hóa Việt Nam có thể chia thành 6 giai đoạn: văn hóa tiền\r\nsử, văn hóa Văn Lang - Âu Lạc, văn hóa thời chống Bắc thuộc, văn hóa Đại\r\nViệt, văn hóa Đại Nam và văn hóa hiện đại. Sáu giai đoạn này tạo thành ba lớp:\r\nlớp văn hóa bản địa, lớp văn hóa giao lưu với Trung Hoa và khu vực, lớp văn\r\nhóa giao lưu với phương Tây.\r\n3.1. Lớp văn hóa bản địa\r\n28\r\nDownloaded by Tu?n ?ào Minh (thichhocchui1999@gmail.com)\r\nlOMoARcPSD|49704028",
"trái), và hình bán nguyệt (đôi dưới, phải). Trước mắt ta là sự hòa hợp tuyệt vời\r\ncủa cái động (vật nhau) trong thế tĩnh của ba hình hình học với những cạnh đáy\r\nvững vàng cho thấy sự ngang sức ngang tài của các chàng trai; sự vận động liên\r\ntục của cơ bắp như dừng lại. Hai người chờ vật được khuôn lại trong hai hình\r\nchữ nhật đứng tạo nên cảm giác co ro bất tận trong cái rét của lễ hội đầu xuân.\r\n4.1.3. Thủ pháp mô hình hóa đã tạo nên một nền nghệ thuật trang trí và\r\nnhiều mô hình mang tính triết lí sâu sắc.\r\nBộ Tứ Linh (Hình 4.20a) với long (rồng) biểu trưng cho uy là nam tính; li\r\n(= long mã) hoặc lân (kì lân, con vật tưởng tượng đầu sư tử, mình nai, đuôi trâu,\r\n131\r\nDownloaded by Tu?n ?ào Minh (thichhocchui1999@gmail.com)\r\nlOMoARcPSD|49704028\r\năn cỏ, rất hiền lành - hình 4.20b) biểu trưng cho ước vọng thái bình, quy (rùa)\r\nhiểu tượng cho sự sống lâu và phượng (phụng) biểu tượng cho nữ tính. Rồng -\r\nPhượng biểu tượng cho hạnh phúc lứa đôi (ở Trung Hoa hiên tượng này là\r\n“loan-phượng”: loan là con đực, phượng là con cái). Đồ án trang trí RỒNG phổ\r\nbiến đến mức phản ánh những đặc trưng cửa từng thời đại. Rồng thời Hùng\r\nvương, thời Lí, Trần, Hồ, Lê, Mạc, Nguyễn – mỗi thời có những nét đặc thù\r\nriêng tương ứng với thời đại của mình.\r\nTứ linh cộng thêm ngư-phúc-hạc-hổ thì thành BÁT VẬT. Ngư (Cá) gắn\r\nvới truyền thuyết \"cá hóa rồng\" biểu tượng cho sự thành đạt. Chữ phúc là “sự tốt\r\nlành, may mắn” đồng âm và viết gần giống với chữ bức nghĩa là \"con dơi\", vì"
]
embeddings = model.encode(sentences)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [4, 4]This is a sentence-transformers model finetuned from Snowflake/snowflake-arctic-embed-m-v2.0 on the csv dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: GteModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("minhtuan7akp/snowflake-m-v2.0-vietnamese_matryoshka-finetune")
# Run inference
sentences = [
'Gia Cát Lượng đã giúp ai trong việc quản lý nước Thục?',
'phải trông coi mọi việc, giúp Thành Vương đến lúc trưởng thành. \r\n4\r\n Hoắc Quang giữ chức Đại tư mã tướng quân, phò Hán Chiêu Đế lúc lên ngôi mới 9 tuổi. \r\n5\r\n Gia Cát Lượng tức Khổng Minh, là thừa tướng của Chiêu Đế Lưu Bị nước Thục đời Tam Quốc. Lưu Bị chết, con là Lưu Thiện nối \r\nngôi, tức Thục Hậu chúa, mọi việc nước, việc quân đều phải trông cậy vào Gia Cát Lượng. \r\n6\r\n Tô Hiến Thành là Thái úy triều Lý Cao Tông, nhận di mệnh Cao Tông phò vua nhỏ là Long Cán lên nối ngôi mới 3 tuổi. \r\n7\r\n Tứ phụ: nghĩa là bốn viên đại thần giúp vua khi mới lên ngôi. \r\n8\r\n Chỉ Thuận Tông. \r\n9\r\n Xích chủy: nghĩa là mõm đỏ, miệng đỏ, hay đỏ mỏ. Xích chủy hầu là loài đỏ mỏ ám chỉ Lê Quý Ly. \r\n10 Bạch kê: nghĩa là gà trắng. Nghệ Tông sinh năm Tân Dậu, tức năm gà. Tân thuộc hành kim, loài kim sắc trắng. Vì thế "bạch kê" \r\nám chỉ Nghệ Tông. \r\n11 Chữ vương? ở trong lòng chữ khẩu? là chữ "quốc"?. \r\n12 Theo tục nhà Trần, hằng năm vào ngày mồng 4 tháng 4, vua hội họp bề tôi làm lễ tuyên thệ ở đền Đồng Cổ. (Xem bản kỷ, quyển \r\n5, Kiến Trung năm thứ 3, 1277). \r\n13 Chỉ Quý Ly. \r\n288 Đại Việt Sử Ký Toàn Thư - Bản Kỷ - Quyển VIII \r\nQuý Ly bỏ mũ, rập đầu khóc lóc từ tạ, chỉ trời vạch đất thề rằng: \r\n"Nếu thần không biết dốc lòng trung, hết sức giúp Quan gia để truyền đến con cháu về sau thì \r\ntrời sẽ ghét bỏ thần". \r\nQuý Ly lại nói: "Lúc Linh Đức Vương làm điều thất đức, nếu không nhờ oai linh bệ hạ thì thần đã',
'Tây. Ngoài cơ sờ đúc súng cũ của tiên triều, năm 1825 vua Minh \r\nMệnh mờ thêm sáu xưởng nữa. vốn cần cù và ham học hỏi sáng \r\ntạo, những người thợ quân giới đã được "thứ súng tay nạp thuốc nổ \r\nmạnh theo kiểu Tây dương". Vào những năm cuối triều Minh \r\nM ệnh, họ đã đúc 15 cỗ đại pháo X ung tiêu băng đồng và hai cỗ \r\nsúng lớn Chấn hải, loại đại pháo lợi hại trong thủy chiến phương \r\nTây. Sau đó, lại xuất xưởng tiếp 30 cỗ Chấn hải. Năm 1829, quản \r\nkho Hải Dương là Tôn Thất Thiện cùng với 100 lính Chấn cơ chế \r\nra cối gỗ chạy bàng sức nước ở khe suối để giã, luyện thuốc súng. \r\nDụng cụ này là xe "Thủy hỏa ký tế", và những năm sau được phổ \r\ncập trong quân ngũ. Từ vũ khí phương Tây, người Đại Nam đã tự \r\ntìm hiểu từng chi tiết để chế tạo thước đo ngắm bắn, thước kiểm tra \r\nthuốc súng. Trong bảy năm ờ ngôi, vua Thiệu Trị đúc 9 cỗ súng \r\nbàng đồng hiệu là "Thần uy phục viễn đại tướng quân", cỗ to nhất \r\nlà 10.706 cân, cỗ nhỏ nhất là 10.222 cân, tổng cộng là 93.829 cân.\r\n649\r\nLỊCH SỬ VIỆT NAM - TẬP 5\r\nVà ba cỗ súng hiệu "Bảo Đại định công an dân hòa chúng thượng \r\ntướng quân", mỗi cỗ trên 14.500 cân, tổng cộng là 43.620 cân1.\r\nĐe tạo điều kiện cho quân thủy học tập, bộ Công cấp cho họ la \r\nbàn, thước đo nước, đồng hồ cát xem giờ của phương Tây. v ề khoa \r\nmục bắn súng thì lính thủy phải tập bắn súng điểu sang và đại bác. \r\nMinh Mệnh yêu cầu Hiệp biện Đại học sĩ lãnh Thượng thư bộ Binh \r\nTrương Đăng Quế đọc kỹ các sách và bản đồ thủy chiến "Tây',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
snowflake_m_v2.0_768, snowflake_m_v2.0_512, snowflake_m_v2.0_256, snowflake_m_v2.0_128 and snowflake_m_v2.0_64InformationRetrievalEvaluator| Metric | snowflake_m_v2.0_768 | snowflake_m_v2.0_512 | snowflake_m_v2.0_256 | snowflake_m_v2.0_128 | snowflake_m_v2.0_64 |
|---|---|---|---|---|---|
| cosine_accuracy@1 | 0.4114 | 0.4037 | 0.4014 | 0.347 | 0.2927 |
| cosine_accuracy@3 | 0.6219 | 0.6205 | 0.6096 | 0.5626 | 0.4804 |
| cosine_accuracy@5 | 0.6909 | 0.6904 | 0.6813 | 0.6311 | 0.5406 |
| cosine_accuracy@10 | 0.7703 | 0.7598 | 0.7562 | 0.7169 | 0.632 |
| cosine_precision@1 | 0.4114 | 0.4037 | 0.4014 | 0.347 | 0.2927 |
| cosine_precision@3 | 0.2073 | 0.2068 | 0.2032 | 0.1875 | 0.1601 |
| cosine_precision@5 | 0.1382 | 0.1381 | 0.1363 | 0.1262 | 0.1081 |
| cosine_precision@10 | 0.077 | 0.076 | 0.0756 | 0.0717 | 0.0632 |
| cosine_recall@1 | 0.4114 | 0.4037 | 0.4014 | 0.347 | 0.2927 |
| cosine_recall@3 | 0.6219 | 0.6205 | 0.6096 | 0.5626 | 0.4804 |
| cosine_recall@5 | 0.6909 | 0.6904 | 0.6813 | 0.6311 | 0.5406 |
| cosine_recall@10 | 0.7703 | 0.7598 | 0.7562 | 0.7169 | 0.632 |
| cosine_ndcg@10 | 0.5909 | 0.5839 | 0.5794 | 0.5313 | 0.4574 |
| cosine_mrr@10 | 0.5336 | 0.5274 | 0.5228 | 0.4721 | 0.4022 |
| cosine_map@100 | 0.5403 | 0.5345 | 0.5299 | 0.4796 | 0.4108 |
anchor and positive| anchor | positive | |
|---|---|---|
| type | string | string |
| details |
|
|
| anchor | positive |
|---|---|
Tính chất kiến trúc của đình làng triều Mạc được thể hiện qua những đặc điểm gì, như số gian, hình dạng, nội thất và cách bố trí không gian trong công trình? |
Đình làng là công trình kiến trúc công cộng được dựng nên |
băng sự đóng góp của cải và công sức của cả cộng đồng làng xã. |
|
Ngoài chức năng là trụ sở hành chính của cả làng, ngôi đình còn là |
|
trung tâm sinh hoạt văn hóa làng xã, là nơi diễn ra các nghi lễ trọng |
|
đại trong dịp tế lễ thần Thành hoàng làng và tô chức hội hè hăng |
|
năm. Có thê nói, ngôi đình làng là nơi hội tụ sức mạnh của cả cộng |
|
đồng và là biểu trưng đặc sắc nhất của văn hóa làng xã. |
|
Trong các ngôi đình triều Mạc, Thân thành hoàng có lý lịch |
|
xuất thân khá phong phú. Tản Viên sơn thánh là vị thần có ảnh |
|
hưởng lớn ở xứ Đoài được thờ phụng ở đình Tây Đăng, Thanh Lũng |
|
và nhiều làng xã khác. Thần Cao Sơn, Quý Minh tương truyền là |
|
tướng tâm phúc của Hùng Vương được thờ ở đình làng Lỗ Hạnh. |
|
Dân làng Lỗ Hạnh còn thờ cả Phương Dung công chúa... Từ thế |
|
kỷ XYVI và các thế kỷ tiếp sau, Thần thành hoàng làng trở thành |
|
vị vua tỉnh thần ở các làng xã, tín ngưỡng thờ cúng Thân thành |
|
hoàng càng trở nên phong phú thê hiện qua lễ... |
|
Nguyễn Khắc Nhu có vai trò gì trong khởi nghĩa toàn khu vực miền núi Bắc Kỳ của Việt Nam Quốc dân Đảng vào năm 1930? |
bị nổ do bất cẩn. Do đó công việc bị phát hiện. Hai người phụ trách |
cơ quan chế bom là Đỗ Cương và Quản Trác trốn thoát. Nhiều binh |
|
lính và dân thường bị bắt. Công việc bạo động của Xứ Nhu không |
|
thành. Đúng lúc này Việt Nam Quốc dân Đảng vừa thành lập, cử |
|
người tới mời Xứ Nhu và Việt Nam Dân quốc gia nhập Việt Nam |
|
Quốc dân Đảng. Hầu hết các đồng chí của Xứ Nhu trở thành đảng |
|
viên của Việt Nam Quốc dân Đảng ở vùng Bắc Ninh, Bắc Giang. |
|
Do đó, Việt Nam Quốc dân Đảng mạnh lên về số lượng1. Cùng với |
|
việc phát triển đảng viên ở Bẳc Ninh, Bắc Giang, Việt Nam Quốc |
|
dân Đảng còn thiết lập nhiều cơ sở ở các tỉnh Thái Bình, Hải Dương, |
|
1. Nguyễn Khắc Nhu tức Xứ Nhu (1882-1930), người làng Song Khê, huyện |
|
Yên Dũng, tinh Bắc Giang. Với lòng yêu nuớc và ý chí chống Pháp, |
|
ông dự tính thành lập một tổ chức hoạt động công khai nhăm đào tạo |
|
tài năng cho đất nước lấy tên là "Hội Quốc dân dục tài”. Việc này |
|
không thành công, ông lại lập tổ chức bí mật nhăm bạo động lật đổ ách |
|
áp b... |
|
Giá gạo tháng 3-1950 ở Liên khu IV là bao nhiêu đồng/tạ và có chênh lệch gì so với giá gạo ở Liên khu III và Liên khu Việt Bắc? |
ngày càng tăng nhanh, nhất là ở Việt Bắc. Giá gạo tăng mạnh |
nhất, giá thực phẩm cũng tăng dần theo giá gạo. Giá các mặt hàng |
|
kỹ nghệ tăng chậm hơn. Giá hàng ngoại hóa hầu như không tăng |
|
vỉ trong vùng Pháp chiếm đóng, hàng ngoại hóa tính bằng tiền |
|
Đông Dương không tăng, hom nữa nhân dân cũng ít tiêu thụ hàng |
|
ngoại hóa vì bị cấm. |
|
1. Viện Kinh tế học, Kinh tế Việt Nam từ Cách mạng Tháng Tám đến..., Sách |
|
đã dẫn, tr. 238. |
|
2. Chuơng trình và báo cáo của Bộ Kinh tế về tình hình hoạt động năm 1950. |
|
Trung tâm lưu trữ quốc gia in, phông Phủ Thủ tướng, Hồ sơ số 1914. |
|
488 |
|
Chương VI. Việt Nam dân chủ cộng hòa xây dựng.. |
|
Giá gạo trong những tháng đầu năm 1950 so với cuối năm 1949 |
|
có thay đổi, Liên khu IV (Thanh Hóa) giá tăng lên 154%; Liên khu |
|
III (Hà Đông - Hà Nam) giá tăng lên 153%; Liên khu Việt Bắc |
|
(Thái Nguyên) giá tăng lên 800%. |
|
Giá gạo ở Thái Nguyên từ 1.625 đồng/tạ lên 13.000 đồng/tạ |
|
(tăng 800%); ờ Phú Thọ từ 2.650 đồng/tạ lên 7.500 đồng/tạ (tăng |
|
283%). Mặt khác, ... |
MatryoshkaLoss with these parameters:{
"loss": "MultipleNegativesRankingLoss",
"matryoshka_dims": [
768,
512,
256,
128,
64
],
"matryoshka_weights": [
1,
1,
1,
1,
1
],
"n_dims_per_step": -1
}
anchor and positive| anchor | positive | |
|---|---|---|
| type | string | string |
| details |
|
|
| anchor | positive |
|---|---|
Nguyễn Hoàng đã thực hiện những hành động gì để dần dần tách khỏi sự ràng buộc của họ Trịnh sau khi trở lại Thuận Quảng vào năm 1600, và những hành động này đã ảnh hưởng như thế nào đến mối quan hệ giữa hai dòng họ? |
thẳng đối với họ Nguyễn. Trịnh Tùng đã lấy danh nghĩa vua Lê sai |
sứ giả là Thiêm đô ngự sử Lê Nghĩa Trạch đem sắc vào phủ dụ |
|
Nguyễn Hoàng và vẫn cho ở lại trấn thủ, hằng năm nộp thuế như |
|
cũ. Cùng với sắc của vua Lê, Trịnh Tùng có gửi thư kèm theo |
|
Chương ĩ. Sự phân liệt Đàng Trong - Đàng Ngoài... |
|
1, Toàn thư. quyển 17, tập IV, Sđd, tr. 200. |
|
2, Đại Nam thực lục, Tiền biên, quyển 1, tập I, Sđd, tr. 34. |
|
3, Đại Nam thực lục, Tiển biên, quyển 1, tập I, Sđd, tr. 35. |
|
39 |
|
LỊCH SỬ VIỆT NAM - TẬP 4 |
|
"khuyên giữ việc thuế cống". Nguyễn Hoàng sai sứ giả đáp lễ tạ on |
|
vua Lê và gửi thư cho Trịnh Tùng hẹn kết nghĩa thông gia, đem con |
|
gái là Ngọc Tú gả cho Trịnh Tráng (con Trịnh Tùng) lấy danh |
|
nghĩa hôn nhân để duy trì mối quan hệ bề ngoài giao hảo giữa hai |
|
dòng họ vốn có sẵn một mối thù địch. |
|
- Chính sách cùa họ Nguyễn từ khi Nguyễn Hoàng trở lại |
|
Thuận Quảng |
|
Năm 1600, Nguyễn Hoàng ròi được khỏi đất Bẳc trở về Thuận |
|
Quảng bắt đầu thực hiện một chính sách cai trị mói, dần dần tác... |
|
Báo cáo của Ủy ban Kháng chiến hành chính Hà Nội về hoạt động giáo dục bù nhìn và tình hình các giáo sư trường Chu Văn An có nội dung gì? |
Tài liệu tham khảo |
21. Báo cáo sô' 2 BC/I ngày 12-11-1949 và Báo cáo sô' 463 |
|
BC/DB ngày 25-12-1949 của Ty Công an H à Nội. Trung |
|
tâm Lưu trữ Quốc gia III, phông Phủ Thủ tướng, Hồ sơ |
|
SỐ921. |
|
28. Báo “Le song” ngày 11-2-1949. Trung tâm Lưu trữ Quốc |
|
gia III, phông Phủ Thủ tướng, Hồ sơ sô' 2002. |
|
29. Báo cáo của u ỷ ban Kháng chiến hành chính Hà Nội vê |
|
hoạt động giáo dục bù nhìn và tình hình các giáo sư |
|
trường Chu Văn An. Trung tâm Lưu trữ Quốc gia III, |
|
phông Phủ Thủ tướng, Hồ sơ số 979. |
|
30. Báo cáo của Tổng Giám đốc Việt N am Công an vụ sô' |
|
122/NCB3 ngày 1-4-1951. Trung tâm Lưu trữ Quốic gia |
|
III, phông Phủ Thủ tướng, Hồ sơ sô' 979. |
|
31. Báo cáo thành tích về cống tác công an trong 8 năm kháng |
|
chiến (1946-1954) của Bộ Công an. Trung tâm Lưu trữ |
|
Quốc gia III, phông Phủ Thủ tướng, Hồ sơ sô' 927. |
|
32. Báo cáo một năm kháng chiến (12-1946 đến 12-1947) của |
|
UBKCHC Khu 12. Trung tâm Lưu trữ Quốc gia III, phông |
|
Phủ Thủ tướng, Hồ sơ sô" 2000. |
|
33. Báo cáo thành tích quăn sự trong 8 n... |
|
Đặc điểm dân số của nước ta ảnh hưởng đến các ngành dịch vụ như thế nào và đòi hỏi những ngành dịch vụ nào cần được ưu tiên phát triển trong quá trình đô thị hóa? |
— Trong các thành phố lớn thường hình thành các trung tâm giao dịch, |
thương mại. Đó là nơi tập trung các ngân hàng, các văn phòng đại diện |
|
của các công ti, các siêu thị hay các tổ hợp thương mại, dịch vụ lớn... |
|
Ở các thành phố lớn trên thế giới, thường dễ nhận thấy các trung tâm |
|
thương mại này do sự tập trung các ngôi nhà cao tầng, chọc trời. Một |
|
thành phố có thể có trung tâm thương mại chính và một số trung tâm |
|
thương mại nhỏ hơn, kết quả của sự phát triển đô thị. |
|
— Ở nước ta, các thành phố, thị xã thường có khu hành chính (phân |
|
“đô”) và khu buôn bán, dịch vụ (phân “thị'). Ở Hà Nội, Thành phố |
|
Hồ Chí Minh các trung tâm giao dịch, thương mại của thành phố đang |
|
được hình thành rõ nét. |
|
CÂU HỎI VÀ BÀI TẬP |
|
174 |
|
1. Cho biết đặc điểm dân số của nước ta (đông, tăng còn tương đối |
|
nhanh, mức sống đang nâng lên và đô thị hoá đang phát triển với |
|
tốc độ nhanh hơn) có ảnh hưởng đến các ngành dịch vụ như thế |
|
nào ? Các đặc điểm đó đòi hỏi những ngành dịch vụ nào cần được |
|
ưu tiê... |
MatryoshkaLoss with these parameters:{
"loss": "MultipleNegativesRankingLoss",
"matryoshka_dims": [
768,
512,
256,
128,
64
],
"matryoshka_weights": [
1,
1,
1,
1,
1
],
"n_dims_per_step": -1
}
eval_strategy: stepsper_device_train_batch_size: 6per_device_eval_batch_size: 6learning_rate: 3e-06num_train_epochs: 2warmup_ratio: 0.05bf16: Truebatch_sampler: no_duplicatesoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: stepsprediction_loss_only: Trueper_device_train_batch_size: 6per_device_eval_batch_size: 6per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 3e-06weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 2max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.05warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Truefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Nonedispatch_batches: Nonesplit_batches: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: no_duplicatesmulti_dataset_batch_sampler: proportional| Epoch | Step | Training Loss | Validation Loss | snowflake_m_v2.0_768_cosine_ndcg@10 | snowflake_m_v2.0_512_cosine_ndcg@10 | snowflake_m_v2.0_256_cosine_ndcg@10 | snowflake_m_v2.0_128_cosine_ndcg@10 | snowflake_m_v2.0_64_cosine_ndcg@10 |
|---|---|---|---|---|---|---|---|---|
| 0.0305 | 100 | 1.7876 | 1.1904 | 0.4785 | 0.4705 | 0.4505 | 0.3318 | 0.2179 |
| 0.0609 | 200 | 1.3408 | 0.8115 | 0.5106 | 0.4999 | 0.4862 | 0.3923 | 0.2731 |
| 0.0914 | 300 | 0.8536 | 0.6208 | 0.5323 | 0.5265 | 0.5109 | 0.4285 | 0.3178 |
| 0.1218 | 400 | 0.6425 | 0.5241 | 0.5477 | 0.5366 | 0.5248 | 0.4483 | 0.3441 |
| 0.1523 | 500 | 0.5621 | 0.4878 | 0.5542 | 0.5406 | 0.5354 | 0.4625 | 0.3625 |
| 0.1827 | 600 | 0.5521 | 0.4712 | 0.5566 | 0.5471 | 0.5392 | 0.4715 | 0.3735 |
| 0.2132 | 700 | 0.5387 | 0.4529 | 0.5623 | 0.5534 | 0.5438 | 0.4803 | 0.3856 |
| 0.2436 | 800 | 0.5439 | 0.4324 | 0.5619 | 0.5526 | 0.5473 | 0.4807 | 0.3895 |
| 0.2741 | 900 | 0.3761 | 0.4220 | 0.5627 | 0.5553 | 0.5499 | 0.4829 | 0.3912 |
| 0.3045 | 1000 | 0.4978 | 0.4020 | 0.5696 | 0.5591 | 0.5527 | 0.4872 | 0.3990 |
| 0.3350 | 1100 | 0.5307 | 0.3927 | 0.5723 | 0.5620 | 0.5589 | 0.4948 | 0.4042 |
| 0.3654 | 1200 | 0.4942 | 0.3823 | 0.5740 | 0.5650 | 0.5630 | 0.5001 | 0.4116 |
| 0.3959 | 1300 | 0.3628 | 0.3754 | 0.5724 | 0.5644 | 0.5613 | 0.4992 | 0.4131 |
| 0.4263 | 1400 | 0.3592 | 0.3584 | 0.5776 | 0.5699 | 0.5624 | 0.5065 | 0.4181 |
| 0.4568 | 1500 | 0.3938 | 0.3521 | 0.5755 | 0.5696 | 0.5627 | 0.5081 | 0.4250 |
| 0.4872 | 1600 | 0.4694 | 0.3486 | 0.5762 | 0.5705 | 0.5630 | 0.5076 | 0.4238 |
| 0.5177 | 1700 | 0.4115 | 0.3561 | 0.5727 | 0.5673 | 0.5616 | 0.5064 | 0.4265 |
| 0.5481 | 1800 | 0.4144 | 0.3371 | 0.5768 | 0.5723 | 0.5649 | 0.5078 | 0.4256 |
| 0.5786 | 1900 | 0.3783 | 0.3334 | 0.5758 | 0.5703 | 0.5638 | 0.5082 | 0.4264 |
| 0.6090 | 2000 | 0.3374 | 0.3302 | 0.5790 | 0.5710 | 0.5661 | 0.5099 | 0.4276 |
| 0.6395 | 2100 | 0.41 | 0.3168 | 0.5817 | 0.5769 | 0.5694 | 0.5164 | 0.4280 |
| 0.6699 | 2200 | 0.4752 | 0.3138 | 0.5826 | 0.5779 | 0.5703 | 0.5156 | 0.4318 |
| 0.7004 | 2300 | 0.2697 | 0.3130 | 0.5837 | 0.5786 | 0.5712 | 0.5178 | 0.4350 |
| 0.7308 | 2400 | 0.4127 | 0.3075 | 0.5826 | 0.5768 | 0.5700 | 0.5153 | 0.4308 |
| 0.7613 | 2500 | 0.3481 | 0.3083 | 0.5842 | 0.5787 | 0.5719 | 0.5182 | 0.4345 |
| 0.7917 | 2600 | 0.329 | 0.2987 | 0.5871 | 0.5828 | 0.5761 | 0.5224 | 0.4350 |
| 0.8222 | 2700 | 0.4066 | 0.2929 | 0.5854 | 0.5796 | 0.5739 | 0.5187 | 0.4366 |
| 0.8526 | 2800 | 0.3523 | 0.2912 | 0.5872 | 0.5791 | 0.5737 | 0.5164 | 0.4403 |
| 0.8831 | 2900 | 0.2931 | 0.2938 | 0.5849 | 0.5773 | 0.5730 | 0.5193 | 0.4401 |
| 0.9135 | 3000 | 0.3608 | 0.2868 | 0.5841 | 0.5769 | 0.5746 | 0.5198 | 0.4405 |
| 0.9440 | 3100 | 0.4988 | 0.2825 | 0.5857 | 0.5790 | 0.5769 | 0.5239 | 0.4436 |
| 0.9744 | 3200 | 0.379 | 0.2772 | 0.5893 | 0.5809 | 0.5780 | 0.5240 | 0.4434 |
| 1.0049 | 3300 | 0.2685 | 0.2730 | 0.5891 | 0.5794 | 0.5784 | 0.5257 | 0.4438 |
| 1.0353 | 3400 | 0.3269 | 0.2679 | 0.5906 | 0.5820 | 0.5794 | 0.5268 | 0.4443 |
| 1.0658 | 3500 | 0.2561 | 0.2672 | 0.5907 | 0.5828 | 0.5789 | 0.5286 | 0.4470 |
| 1.0962 | 3600 | 0.2696 | 0.2663 | 0.5930 | 0.5840 | 0.5799 | 0.5270 | 0.4464 |
| 1.1267 | 3700 | 0.2973 | 0.2674 | 0.5910 | 0.5829 | 0.5775 | 0.5281 | 0.4475 |
| 1.1571 | 3800 | 0.2717 | 0.2675 | 0.5884 | 0.5802 | 0.5769 | 0.5276 | 0.4493 |
| 1.1876 | 3900 | 0.2932 | 0.2615 | 0.5894 | 0.5812 | 0.5791 | 0.5285 | 0.4527 |
| 1.2180 | 4000 | 0.3191 | 0.2597 | 0.5902 | 0.5831 | 0.5771 | 0.5280 | 0.4521 |
| 1.2485 | 4100 | 0.2936 | 0.2583 | 0.5903 | 0.5831 | 0.5792 | 0.5280 | 0.4517 |
| 1.2789 | 4200 | 0.2266 | 0.2609 | 0.5879 | 0.5814 | 0.5764 | 0.5276 | 0.4547 |
| 1.3094 | 4300 | 0.2712 | 0.2606 | 0.5895 | 0.5818 | 0.5784 | 0.5269 | 0.4546 |
| 1.3398 | 4400 | 0.3014 | 0.2609 | 0.5898 | 0.5815 | 0.5772 | 0.5278 | 0.4551 |
| 1.3703 | 4500 | 0.2104 | 0.2607 | 0.5892 | 0.5815 | 0.5771 | 0.5268 | 0.4548 |
| 1.4007 | 4600 | 0.4204 | 0.2614 | 0.5881 | 0.5812 | 0.5757 | 0.5270 | 0.4551 |
| 1.4312 | 4700 | 0.2502 | 0.2614 | 0.5894 | 0.5801 | 0.5773 | 0.5288 | 0.4551 |
| 1.4616 | 4800 | 0.171 | 0.2605 | 0.5892 | 0.5805 | 0.5777 | 0.5306 | 0.4582 |
| 1.4921 | 4900 | 0.2284 | 0.2625 | 0.5881 | 0.5816 | 0.5771 | 0.5297 | 0.4574 |
| 1.5225 | 5000 | 0.2021 | 0.2597 | 0.5897 | 0.5814 | 0.5785 | 0.5294 | 0.4572 |
| 1.5530 | 5100 | 0.3218 | 0.2596 | 0.5900 | 0.5826 | 0.5783 | 0.5301 | 0.4575 |
| 1.5834 | 5200 | 0.2402 | 0.2586 | 0.5894 | 0.5821 | 0.5788 | 0.5290 | 0.4581 |
| 1.6139 | 5300 | 0.3036 | 0.2562 | 0.5910 | 0.5825 | 0.5780 | 0.5311 | 0.4576 |
| 1.6443 | 5400 | 0.2906 | 0.2558 | 0.5903 | 0.5822 | 0.5795 | 0.5301 | 0.4578 |
| 1.6748 | 5500 | 0.2319 | 0.2553 | 0.5901 | 0.5829 | 0.5785 | 0.5311 | 0.4583 |
| 1.7052 | 5600 | 0.2315 | 0.2544 | 0.5896 | 0.5821 | 0.5775 | 0.5313 | 0.4581 |
| 1.7357 | 5700 | 0.2448 | 0.2541 | 0.5897 | 0.5831 | 0.5783 | 0.5310 | 0.4573 |
| 1.7661 | 5800 | 0.1683 | 0.2533 | 0.5906 | 0.5840 | 0.5785 | 0.5307 | 0.4576 |
| 1.7966 | 5900 | 0.2424 | 0.2536 | 0.5913 | 0.5841 | 0.5783 | 0.5312 | 0.4585 |
| 1.8270 | 6000 | 0.2169 | 0.2539 | 0.5905 | 0.5832 | 0.5787 | 0.5305 | 0.4574 |
| 1.8575 | 6100 | 0.2504 | 0.2541 | 0.5918 | 0.5830 | 0.5780 | 0.5306 | 0.4575 |
| 1.8879 | 6200 | 0.1923 | 0.2540 | 0.5908 | 0.5841 | 0.5781 | 0.5309 | 0.4585 |
| 1.9184 | 6300 | 0.2375 | 0.2533 | 0.5904 | 0.5839 | 0.5790 | 0.5306 | 0.4581 |
| 1.9488 | 6400 | 0.2248 | 0.2529 | 0.5904 | 0.5844 | 0.5777 | 0.5316 | 0.4577 |
| 1.9793 | 6500 | 0.1819 | 0.2532 | 0.5909 | 0.5839 | 0.5794 | 0.5313 | 0.4574 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{kusupati2024matryoshka,
title={Matryoshka Representation Learning},
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
year={2024},
eprint={2205.13147},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
Snowflake/snowflake-arctic-embed-m-v2.0