当前位置: 首页 > news >正文

CCF CSP题解:矩阵运算(202305-2)

链接和思路

OJ链接:传送门

本题要求计算1个公式:
( W ⋅ ( Q × K T ) ) × V \left(\mathbf{W} \cdot (\mathbf{Q} \times \mathbf{K}^{T})\right) \times \mathbf{V} (W(Q×KT))×V
其中, Q \mathbf{Q} Q K \mathbf{K} K V \mathbf{V} V均是 n n n d d d列的矩阵, K T \mathbf{K}^{T} KT,表示矩阵 K \mathbf{K} K的转置, × \times ×表示矩阵乘法。 ⋅ \cdot 为点乘,即对应位相乘,记 W ( i ) \mathbf{W}^{(i)} W(i)为向量 W \mathbf{W} W的第 i i i个元素,即将 ( Q × K T ) (\mathbf{Q} \times \mathbf{K}^{T}) (Q×KT) i i i行中的每个元素都与 W ( i ) \mathbf{W}^{(i)} W(i)相乘。

本题有2点需要注意,否则只能过70%的样例:

  • 使用int会导致溢出,可使用long long表示数据。
  • 如果按照公式给出的顺序计算,复杂度为 O ( d n 2 ) O(dn^2) O(dn2),注意到 n n n远大于 d d d,因此应该修改运算顺序,优化到 O ( d 2 n ) O(d^2n) O(d2n)

由于注意到矩阵乘法 A n × m × B m × k \mathbf{A}_{n\times m} \times \mathbf{B}_{m \times k} An×m×Bm×k的复杂度是 O ( n m k ) O(nmk) O(nmk),因此我们尽可能要让 m m m更小,于是原式的计算顺序可以改变为:
( W ⋅ ( Q × K T ) ) × V = W ⋅ ( Q × ( K T × V ) ) \left(\mathbf{W} \cdot (\mathbf{Q} \times \mathbf{K}^{T})\right) \times \mathbf{V} =\mathbf{W} \cdot \left(\mathbf{Q} \times (\mathbf{K}^{T} \times \mathbf{V} ) \right) (W(Q×KT))×V=W(Q×(KT×V))
调整矩阵乘法顺序在矩阵乘法计算中是十分常见的,如果是一连串任意给定的矩阵相乘,可以用动态规划的方法得到最优的矩阵运算效率。此外,使用行优先的方式比列优先更能充分利用缓存命中率,这也是优化矩阵乘法效率的一个思路,但是由于已经满分,因此在本题中我们没有继续优化。

AC代码

#include <iostream>
#include <vector>using namespace std;void print_vector(const vector<vector<long long>> &arr) {for (int i = 0; i < arr.size(); i++) {for (int j = 0; j < arr[0].size(); j++) {if (j != 0)cout << " ";cout << arr[i][j];}cout << endl;}
}int main() {int n, d;cin >> n >> d;vector<vector<long long>> q(n), k(n), v(n);vector<long long> w(n);for (int i = 0; i < n; ++i) {q[i].resize(d);for (int j = 0; j < d; ++j) {cin >> q[i][j];}}for (int i = 0; i < n; ++i) {k[i].resize(d);for (int j = 0; j < d; ++j) {cin >> k[i][j];}}for (int i = 0; i < n; ++i) {v[i].resize(d);for (int j = 0; j < d; ++j) {cin >> v[i][j];}}for (int i = 0; i < n; ++i) {cin >> w[i];}//kv: d x dvector<vector<long long>> kv(d);for (int i = 0; i < d; ++i) {kv[i].resize(d);}for (int i = 0; i < d; ++i) {for (int j = 0; j < d; ++j) {for (int l = 0; l < n; ++l) {kv[i][j] += k[l][i] * v[l][j];}}}//qkv: n x dfor (int i = 0; i < n; ++i) {for (int j = 0; j < d; ++j) {k[i][j] = 0;for (int l = 0; l < d; ++l) {k[i][j] += q[i][l] * kv[l][j];
//                printf("k[%d][%d]=%d\n", i, j, k[i][j]);}}}// wqkv: n x dfor (int i = 0; i < n; i++)for (int j = 0; j < d; ++j)k[i][j] *= w[i];print_vector(k);return 0;
}
http://www.lryc.cn/news/149988.html

相关文章:

  • 划分字母区间【贪心算法】
  • 低代码的探索之路
  • easyUI combobox不可手动输入和禁用
  • RV64和ARM64栈结构差异
  • 将 Python 与 RStudio IDE 配合使用(R与Python系列第一篇)
  • 数据库访问性能优化
  • vue 预览 有token验证的 doc、docx、pdf、xlsx、csv、图片 并下载
  • WPF数据视图
  • C++ new/delete 与 malloc/free 的区别?
  • 【数学建模】常微分,偏微分方程
  • 浙大数据结构之09-排序1 排序
  • Pydantic 学习随笔
  • 11 mysql float/double/decimal 的数据存储
  • 【高效数据结构——位图bitmap】
  • ArrayList LinkedList
  • iOS砸壳系列之三:Frida介绍和使用
  • Git学习——细节补充
  • 【设计模式】Head First 设计模式——装饰者模式 C++实现
  • layui实现数据列表的复选框回显
  • 关于使用RT-Thread系统读取stm32的adc无法连续转换的问题解决
  • 【启扬方案】启扬多尺寸安卓屏一体机,助力仓储物料管理系统智能化管理
  • Android Glide使用姿势与原理分析
  • 管理类联考——逻辑——汇总篇——知识点突破——形式逻辑——联言选言——真假
  • ChatGPT数据分析及作图插件推荐-Code Interpreter
  • 说说FLINK细粒度滑动窗口如何处理
  • 记一次反弹shell的操作【非常简单】
  • 如何排查 Flink Checkpoint 失败问题?
  • lazarus(pascal)和c语言读日志文件筛选保存为新文件
  • 学习JAVA打卡第四十九天
  • Golang数据结构和算法