1 // SPDX-License-Identifier: GPL-2.0-only
2 
3 #include <linux/kernel.h>
4 #include <linux/init.h>
5 #include <linux/module.h>
6 #include <linux/netlink.h>
7 #include <linux/netfilter.h>
8 #include <linux/netfilter/nf_tables.h>
9 #include <net/netfilter/nf_tables_core.h>
10 #include <net/netfilter/nf_tables.h>
11 #include <net/netfilter/nft_fib.h>
12 
13 #include <net/ip_fib.h>
14 #include <net/route.h>
15 
16 /* don't try to find route from mcast/bcast/zeronet */
17 static __be32 get_saddr(__be32 addr)
18 {
19 	if (ipv4_is_multicast(addr) || ipv4_is_lbcast(addr) ||
20 	    ipv4_is_zeronet(addr))
21 		return 0;
22 	return addr;
23 }
24 
25 #define DSCP_BITS     0xfc
26 
27 void nft_fib4_eval_type(const struct nft_expr *expr, struct nft_regs *regs,
28 			const struct nft_pktinfo *pkt)
29 {
30 	const struct nft_fib *priv = nft_expr_priv(expr);
31 	int noff = skb_network_offset(pkt->skb);
32 	u32 *dst = &regs->data[priv->dreg];
33 	const struct net_device *dev = NULL;
34 	struct iphdr *iph, _iph;
35 	__be32 addr;
36 
37 	if (priv->flags & NFTA_FIB_F_IIF)
38 		dev = nft_in(pkt);
39 	else if (priv->flags & NFTA_FIB_F_OIF)
40 		dev = nft_out(pkt);
41 
42 	iph = skb_header_pointer(pkt->skb, noff, sizeof(_iph), &_iph);
43 	if (!iph) {
44 		regs->verdict.code = NFT_BREAK;
45 		return;
46 	}
47 
48 	if (priv->flags & NFTA_FIB_F_DADDR)
49 		addr = iph->daddr;
50 	else
51 		addr = iph->saddr;
52 
53 	*dst = inet_dev_addr_type(nft_net(pkt), dev, addr);
54 }
55 EXPORT_SYMBOL_GPL(nft_fib4_eval_type);
56 
57 void nft_fib4_eval(const struct nft_expr *expr, struct nft_regs *regs,
58 		   const struct nft_pktinfo *pkt)
59 {
60 	const struct nft_fib *priv = nft_expr_priv(expr);
61 	int noff = skb_network_offset(pkt->skb);
62 	u32 *dest = &regs->data[priv->dreg];
63 	struct iphdr *iph, _iph;
64 	struct fib_result res;
65 	struct flowi4 fl4 = {
66 		.flowi4_scope = RT_SCOPE_UNIVERSE,
67 		.flowi4_iif = LOOPBACK_IFINDEX,
68 	};
69 	const struct net_device *oif;
70 	const struct net_device *found;
71 
72 	/*
73 	 * Do not set flowi4_oif, it restricts results (for example, asking
74 	 * for oif 3 will get RTN_UNICAST result even if the daddr exits
75 	 * on another interface.
76 	 *
77 	 * Search results for the desired outinterface instead.
78 	 */
79 	if (priv->flags & NFTA_FIB_F_OIF)
80 		oif = nft_out(pkt);
81 	else if (priv->flags & NFTA_FIB_F_IIF)
82 		oif = nft_in(pkt);
83 	else
84 		oif = NULL;
85 
86 	if (nft_hook(pkt) == NF_INET_PRE_ROUTING &&
87 	    nft_fib_is_loopback(pkt->skb, nft_in(pkt))) {
88 		nft_fib_store_result(dest, priv, nft_in(pkt));
89 		return;
90 	}
91 
92 	iph = skb_header_pointer(pkt->skb, noff, sizeof(_iph), &_iph);
93 	if (!iph) {
94 		regs->verdict.code = NFT_BREAK;
95 		return;
96 	}
97 
98 	if (ipv4_is_zeronet(iph->saddr)) {
99 		if (ipv4_is_lbcast(iph->daddr) ||
100 		    ipv4_is_local_multicast(iph->daddr)) {
101 			nft_fib_store_result(dest, priv, pkt->skb->dev);
102 			return;
103 		}
104 	}
105 
106 	if (priv->flags & NFTA_FIB_F_MARK)
107 		fl4.flowi4_mark = pkt->skb->mark;
108 
109 	fl4.flowi4_tos = iph->tos & DSCP_BITS;
110 
111 	if (priv->flags & NFTA_FIB_F_DADDR) {
112 		fl4.daddr = iph->daddr;
113 		fl4.saddr = get_saddr(iph->saddr);
114 	} else {
115 		if (nft_hook(pkt) == NF_INET_FORWARD &&
116 		    priv->flags & NFTA_FIB_F_IIF)
117 			fl4.flowi4_iif = nft_out(pkt)->ifindex;
118 
119 		fl4.daddr = iph->saddr;
120 		fl4.saddr = get_saddr(iph->daddr);
121 	}
122 
123 	*dest = 0;
124 
125 	if (fib_lookup(nft_net(pkt), &fl4, &res, FIB_LOOKUP_IGNORE_LINKSTATE))
126 		return;
127 
128 	switch (res.type) {
129 	case RTN_UNICAST:
130 		break;
131 	case RTN_LOCAL: /* Should not see RTN_LOCAL here */
132 		return;
133 	default:
134 		break;
135 	}
136 
137        if (!oif) {
138                found = FIB_RES_DEV(res);
139 	} else {
140 		if (!fib_info_nh_uses_dev(res.fi, oif))
141 			return;
142 
143 		found = oif;
144 	}
145 
146 	nft_fib_store_result(dest, priv, found);
147 }
148 EXPORT_SYMBOL_GPL(nft_fib4_eval);
149 
150 static struct nft_expr_type nft_fib4_type;
151 
152 static const struct nft_expr_ops nft_fib4_type_ops = {
153 	.type		= &nft_fib4_type,
154 	.size		= NFT_EXPR_SIZE(sizeof(struct nft_fib)),
155 	.eval		= nft_fib4_eval_type,
156 	.init		= nft_fib_init,
157 	.dump		= nft_fib_dump,
158 	.validate	= nft_fib_validate,
159 	.reduce		= nft_fib_reduce,
160 };
161 
162 static const struct nft_expr_ops nft_fib4_ops = {
163 	.type		= &nft_fib4_type,
164 	.size		= NFT_EXPR_SIZE(sizeof(struct nft_fib)),
165 	.eval		= nft_fib4_eval,
166 	.init		= nft_fib_init,
167 	.dump		= nft_fib_dump,
168 	.validate	= nft_fib_validate,
169 	.reduce		= nft_fib_reduce,
170 };
171 
172 static const struct nft_expr_ops *
173 nft_fib4_select_ops(const struct nft_ctx *ctx,
174 		    const struct nlattr * const tb[])
175 {
176 	enum nft_fib_result result;
177 
178 	if (!tb[NFTA_FIB_RESULT])
179 		return ERR_PTR(-EINVAL);
180 
181 	result = ntohl(nla_get_be32(tb[NFTA_FIB_RESULT]));
182 
183 	switch (result) {
184 	case NFT_FIB_RESULT_OIF:
185 		return &nft_fib4_ops;
186 	case NFT_FIB_RESULT_OIFNAME:
187 		return &nft_fib4_ops;
188 	case NFT_FIB_RESULT_ADDRTYPE:
189 		return &nft_fib4_type_ops;
190 	default:
191 		return ERR_PTR(-EOPNOTSUPP);
192 	}
193 }
194 
195 static struct nft_expr_type nft_fib4_type __read_mostly = {
196 	.name		= "fib",
197 	.select_ops	= nft_fib4_select_ops,
198 	.policy		= nft_fib_policy,
199 	.maxattr	= NFTA_FIB_MAX,
200 	.family		= NFPROTO_IPV4,
201 	.owner		= THIS_MODULE,
202 };
203 
204 static int __init nft_fib4_module_init(void)
205 {
206 	return nft_register_expr(&nft_fib4_type);
207 }
208 
209 static void __exit nft_fib4_module_exit(void)
210 {
211 	nft_unregister_expr(&nft_fib4_type);
212 }
213 
214 module_init(nft_fib4_module_init);
215 module_exit(nft_fib4_module_exit);
216 MODULE_LICENSE("GPL");
217 MODULE_AUTHOR("Florian Westphal <fw@strlen.de>");
218 MODULE_ALIAS_NFT_AF_EXPR(2, "fib");
219 MODULE_DESCRIPTION("nftables fib / ip route lookup support");
220