xref: /openbmc/linux/lib/lzo/lzo1x_compress.c (revision 5ee4014af99f77dac89e01961b717d13ff1a8ea5)
164c70b1cSRichard Purdie /*
28b975bd3SMarkus F.X.J. Oberhumer  *  LZO1X Compressor from LZO
364c70b1cSRichard Purdie  *
48b975bd3SMarkus F.X.J. Oberhumer  *  Copyright (C) 1996-2012 Markus F.X.J. Oberhumer <markus@oberhumer.com>
564c70b1cSRichard Purdie  *
664c70b1cSRichard Purdie  *  The full LZO package can be found at:
764c70b1cSRichard Purdie  *  http://www.oberhumer.com/opensource/lzo/
864c70b1cSRichard Purdie  *
98b975bd3SMarkus F.X.J. Oberhumer  *  Changed for Linux kernel use by:
1064c70b1cSRichard Purdie  *  Nitin Gupta <nitingupta910@gmail.com>
1164c70b1cSRichard Purdie  *  Richard Purdie <rpurdie@openedhand.com>
1264c70b1cSRichard Purdie  */
1364c70b1cSRichard Purdie 
1464c70b1cSRichard Purdie #include <linux/module.h>
1564c70b1cSRichard Purdie #include <linux/kernel.h>
1664c70b1cSRichard Purdie #include <asm/unaligned.h>
178b975bd3SMarkus F.X.J. Oberhumer #include <linux/lzo.h>
1864c70b1cSRichard Purdie #include "lzodefs.h"
1964c70b1cSRichard Purdie 
2064c70b1cSRichard Purdie static noinline size_t
218b975bd3SMarkus F.X.J. Oberhumer lzo1x_1_do_compress(const unsigned char *in, size_t in_len,
228b975bd3SMarkus F.X.J. Oberhumer 		    unsigned char *out, size_t *out_len,
23*5ee4014aSDave Rodgman 		    size_t ti, void *wrkmem, signed char *state_offset)
2464c70b1cSRichard Purdie {
258b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char *ip;
268b975bd3SMarkus F.X.J. Oberhumer 	unsigned char *op;
2764c70b1cSRichard Purdie 	const unsigned char * const in_end = in + in_len;
288b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char * const ip_end = in + in_len - 20;
298b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char *ii;
308b975bd3SMarkus F.X.J. Oberhumer 	lzo_dict_t * const dict = (lzo_dict_t *) wrkmem;
3164c70b1cSRichard Purdie 
328b975bd3SMarkus F.X.J. Oberhumer 	op = out;
338b975bd3SMarkus F.X.J. Oberhumer 	ip = in;
348b975bd3SMarkus F.X.J. Oberhumer 	ii = ip;
358b975bd3SMarkus F.X.J. Oberhumer 	ip += ti < 4 ? 4 - ti : 0;
3664c70b1cSRichard Purdie 
3764c70b1cSRichard Purdie 	for (;;) {
38*5ee4014aSDave Rodgman 		const unsigned char *m_pos = NULL;
398b975bd3SMarkus F.X.J. Oberhumer 		size_t t, m_len, m_off;
408b975bd3SMarkus F.X.J. Oberhumer 		u32 dv;
41*5ee4014aSDave Rodgman 		u32 run_length = 0;
4264c70b1cSRichard Purdie literal:
438b975bd3SMarkus F.X.J. Oberhumer 		ip += 1 + ((ip - ii) >> 5);
448b975bd3SMarkus F.X.J. Oberhumer next:
4564c70b1cSRichard Purdie 		if (unlikely(ip >= ip_end))
4664c70b1cSRichard Purdie 			break;
478b975bd3SMarkus F.X.J. Oberhumer 		dv = get_unaligned_le32(ip);
48*5ee4014aSDave Rodgman 
49*5ee4014aSDave Rodgman 		if (dv == 0) {
50*5ee4014aSDave Rodgman 			const unsigned char *ir = ip + 4;
51*5ee4014aSDave Rodgman 			const unsigned char *limit = ip_end
52*5ee4014aSDave Rodgman 				< (ip + MAX_ZERO_RUN_LENGTH + 1)
53*5ee4014aSDave Rodgman 				? ip_end : ip + MAX_ZERO_RUN_LENGTH + 1;
54*5ee4014aSDave Rodgman #if defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && \
55*5ee4014aSDave Rodgman 	defined(LZO_FAST_64BIT_MEMORY_ACCESS)
56*5ee4014aSDave Rodgman 			u64 dv64;
57*5ee4014aSDave Rodgman 
58*5ee4014aSDave Rodgman 			for (; (ir + 32) <= limit; ir += 32) {
59*5ee4014aSDave Rodgman 				dv64 = get_unaligned((u64 *)ir);
60*5ee4014aSDave Rodgman 				dv64 |= get_unaligned((u64 *)ir + 1);
61*5ee4014aSDave Rodgman 				dv64 |= get_unaligned((u64 *)ir + 2);
62*5ee4014aSDave Rodgman 				dv64 |= get_unaligned((u64 *)ir + 3);
63*5ee4014aSDave Rodgman 				if (dv64)
64*5ee4014aSDave Rodgman 					break;
65*5ee4014aSDave Rodgman 			}
66*5ee4014aSDave Rodgman 			for (; (ir + 8) <= limit; ir += 8) {
67*5ee4014aSDave Rodgman 				dv64 = get_unaligned((u64 *)ir);
68*5ee4014aSDave Rodgman 				if (dv64) {
69*5ee4014aSDave Rodgman #  if defined(__LITTLE_ENDIAN)
70*5ee4014aSDave Rodgman 					ir += __builtin_ctzll(dv64) >> 3;
71*5ee4014aSDave Rodgman #  elif defined(__BIG_ENDIAN)
72*5ee4014aSDave Rodgman 					ir += __builtin_clzll(dv64) >> 3;
73*5ee4014aSDave Rodgman #  else
74*5ee4014aSDave Rodgman #    error "missing endian definition"
75*5ee4014aSDave Rodgman #  endif
76*5ee4014aSDave Rodgman 					break;
77*5ee4014aSDave Rodgman 				}
78*5ee4014aSDave Rodgman 			}
79*5ee4014aSDave Rodgman #else
80*5ee4014aSDave Rodgman 			while ((ir < (const unsigned char *)
81*5ee4014aSDave Rodgman 					ALIGN((uintptr_t)ir, 4)) &&
82*5ee4014aSDave Rodgman 					(ir < limit) && (*ir == 0))
83*5ee4014aSDave Rodgman 				ir++;
84*5ee4014aSDave Rodgman 			for (; (ir + 4) <= limit; ir += 4) {
85*5ee4014aSDave Rodgman 				dv = *((u32 *)ir);
86*5ee4014aSDave Rodgman 				if (dv) {
87*5ee4014aSDave Rodgman #  if defined(__LITTLE_ENDIAN)
88*5ee4014aSDave Rodgman 					ir += __builtin_ctz(dv) >> 3;
89*5ee4014aSDave Rodgman #  elif defined(__BIG_ENDIAN)
90*5ee4014aSDave Rodgman 					ir += __builtin_clz(dv) >> 3;
91*5ee4014aSDave Rodgman #  else
92*5ee4014aSDave Rodgman #    error "missing endian definition"
93*5ee4014aSDave Rodgman #  endif
94*5ee4014aSDave Rodgman 					break;
95*5ee4014aSDave Rodgman 				}
96*5ee4014aSDave Rodgman 			}
97*5ee4014aSDave Rodgman #endif
98*5ee4014aSDave Rodgman 			while (likely(ir < limit) && unlikely(*ir == 0))
99*5ee4014aSDave Rodgman 				ir++;
100*5ee4014aSDave Rodgman 			run_length = ir - ip;
101*5ee4014aSDave Rodgman 			if (run_length > MAX_ZERO_RUN_LENGTH)
102*5ee4014aSDave Rodgman 				run_length = MAX_ZERO_RUN_LENGTH;
103*5ee4014aSDave Rodgman 		} else {
1048b975bd3SMarkus F.X.J. Oberhumer 			t = ((dv * 0x1824429d) >> (32 - D_BITS)) & D_MASK;
1058b975bd3SMarkus F.X.J. Oberhumer 			m_pos = in + dict[t];
1068b975bd3SMarkus F.X.J. Oberhumer 			dict[t] = (lzo_dict_t) (ip - in);
1078b975bd3SMarkus F.X.J. Oberhumer 			if (unlikely(dv != get_unaligned_le32(m_pos)))
1088b975bd3SMarkus F.X.J. Oberhumer 				goto literal;
109*5ee4014aSDave Rodgman 		}
11064c70b1cSRichard Purdie 
1118b975bd3SMarkus F.X.J. Oberhumer 		ii -= ti;
1128b975bd3SMarkus F.X.J. Oberhumer 		ti = 0;
1138b975bd3SMarkus F.X.J. Oberhumer 		t = ip - ii;
1148b975bd3SMarkus F.X.J. Oberhumer 		if (t != 0) {
11564c70b1cSRichard Purdie 			if (t <= 3) {
116*5ee4014aSDave Rodgman 				op[*state_offset] |= t;
1178b975bd3SMarkus F.X.J. Oberhumer 				COPY4(op, ii);
1188b975bd3SMarkus F.X.J. Oberhumer 				op += t;
1198b975bd3SMarkus F.X.J. Oberhumer 			} else if (t <= 16) {
1208b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (t - 3);
1218b975bd3SMarkus F.X.J. Oberhumer 				COPY8(op, ii);
1228b975bd3SMarkus F.X.J. Oberhumer 				COPY8(op + 8, ii + 8);
1238b975bd3SMarkus F.X.J. Oberhumer 				op += t;
1248b975bd3SMarkus F.X.J. Oberhumer 			} else {
1258b975bd3SMarkus F.X.J. Oberhumer 				if (t <= 18) {
12664c70b1cSRichard Purdie 					*op++ = (t - 3);
12764c70b1cSRichard Purdie 				} else {
12864c70b1cSRichard Purdie 					size_t tt = t - 18;
12964c70b1cSRichard Purdie 					*op++ = 0;
1308b975bd3SMarkus F.X.J. Oberhumer 					while (unlikely(tt > 255)) {
13164c70b1cSRichard Purdie 						tt -= 255;
13264c70b1cSRichard Purdie 						*op++ = 0;
13364c70b1cSRichard Purdie 					}
13464c70b1cSRichard Purdie 					*op++ = tt;
13564c70b1cSRichard Purdie 				}
13664c70b1cSRichard Purdie 				do {
1378b975bd3SMarkus F.X.J. Oberhumer 					COPY8(op, ii);
1388b975bd3SMarkus F.X.J. Oberhumer 					COPY8(op + 8, ii + 8);
1398b975bd3SMarkus F.X.J. Oberhumer 					op += 16;
1408b975bd3SMarkus F.X.J. Oberhumer 					ii += 16;
1418b975bd3SMarkus F.X.J. Oberhumer 					t -= 16;
1428b975bd3SMarkus F.X.J. Oberhumer 				} while (t >= 16);
1438b975bd3SMarkus F.X.J. Oberhumer 				if (t > 0) do {
14464c70b1cSRichard Purdie 					*op++ = *ii++;
14564c70b1cSRichard Purdie 				} while (--t > 0);
14664c70b1cSRichard Purdie 			}
1478b975bd3SMarkus F.X.J. Oberhumer 		}
14864c70b1cSRichard Purdie 
149*5ee4014aSDave Rodgman 		if (unlikely(run_length)) {
150*5ee4014aSDave Rodgman 			ip += run_length;
151*5ee4014aSDave Rodgman 			run_length -= MIN_ZERO_RUN_LENGTH;
152*5ee4014aSDave Rodgman 			put_unaligned_le32((run_length << 21) | 0xfffc18
153*5ee4014aSDave Rodgman 					   | (run_length & 0x7), op);
154*5ee4014aSDave Rodgman 			op += 4;
155*5ee4014aSDave Rodgman 			run_length = 0;
156*5ee4014aSDave Rodgman 			*state_offset = -3;
157*5ee4014aSDave Rodgman 			goto finished_writing_instruction;
158*5ee4014aSDave Rodgman 		}
159*5ee4014aSDave Rodgman 
1608b975bd3SMarkus F.X.J. Oberhumer 		m_len = 4;
1618b975bd3SMarkus F.X.J. Oberhumer 		{
1628b975bd3SMarkus F.X.J. Oberhumer #if defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && defined(LZO_USE_CTZ64)
1638b975bd3SMarkus F.X.J. Oberhumer 		u64 v;
1648b975bd3SMarkus F.X.J. Oberhumer 		v = get_unaligned((const u64 *) (ip + m_len)) ^
1658b975bd3SMarkus F.X.J. Oberhumer 		    get_unaligned((const u64 *) (m_pos + m_len));
1668b975bd3SMarkus F.X.J. Oberhumer 		if (unlikely(v == 0)) {
1678b975bd3SMarkus F.X.J. Oberhumer 			do {
1688b975bd3SMarkus F.X.J. Oberhumer 				m_len += 8;
1698b975bd3SMarkus F.X.J. Oberhumer 				v = get_unaligned((const u64 *) (ip + m_len)) ^
1708b975bd3SMarkus F.X.J. Oberhumer 				    get_unaligned((const u64 *) (m_pos + m_len));
1718b975bd3SMarkus F.X.J. Oberhumer 				if (unlikely(ip + m_len >= ip_end))
1728b975bd3SMarkus F.X.J. Oberhumer 					goto m_len_done;
1738b975bd3SMarkus F.X.J. Oberhumer 			} while (v == 0);
1748b975bd3SMarkus F.X.J. Oberhumer 		}
1758b975bd3SMarkus F.X.J. Oberhumer #  if defined(__LITTLE_ENDIAN)
1768b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_ctzll(v) / 8;
1778b975bd3SMarkus F.X.J. Oberhumer #  elif defined(__BIG_ENDIAN)
1788b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_clzll(v) / 8;
1798b975bd3SMarkus F.X.J. Oberhumer #  else
1808b975bd3SMarkus F.X.J. Oberhumer #    error "missing endian definition"
1818b975bd3SMarkus F.X.J. Oberhumer #  endif
1828b975bd3SMarkus F.X.J. Oberhumer #elif defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && defined(LZO_USE_CTZ32)
1838b975bd3SMarkus F.X.J. Oberhumer 		u32 v;
1848b975bd3SMarkus F.X.J. Oberhumer 		v = get_unaligned((const u32 *) (ip + m_len)) ^
1858b975bd3SMarkus F.X.J. Oberhumer 		    get_unaligned((const u32 *) (m_pos + m_len));
1868b975bd3SMarkus F.X.J. Oberhumer 		if (unlikely(v == 0)) {
1878b975bd3SMarkus F.X.J. Oberhumer 			do {
1888b975bd3SMarkus F.X.J. Oberhumer 				m_len += 4;
1898b975bd3SMarkus F.X.J. Oberhumer 				v = get_unaligned((const u32 *) (ip + m_len)) ^
1908b975bd3SMarkus F.X.J. Oberhumer 				    get_unaligned((const u32 *) (m_pos + m_len));
1918b975bd3SMarkus F.X.J. Oberhumer 				if (v != 0)
1928b975bd3SMarkus F.X.J. Oberhumer 					break;
1938b975bd3SMarkus F.X.J. Oberhumer 				m_len += 4;
1948b975bd3SMarkus F.X.J. Oberhumer 				v = get_unaligned((const u32 *) (ip + m_len)) ^
1958b975bd3SMarkus F.X.J. Oberhumer 				    get_unaligned((const u32 *) (m_pos + m_len));
1968b975bd3SMarkus F.X.J. Oberhumer 				if (unlikely(ip + m_len >= ip_end))
1978b975bd3SMarkus F.X.J. Oberhumer 					goto m_len_done;
1988b975bd3SMarkus F.X.J. Oberhumer 			} while (v == 0);
1998b975bd3SMarkus F.X.J. Oberhumer 		}
2008b975bd3SMarkus F.X.J. Oberhumer #  if defined(__LITTLE_ENDIAN)
2018b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_ctz(v) / 8;
2028b975bd3SMarkus F.X.J. Oberhumer #  elif defined(__BIG_ENDIAN)
2038b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_clz(v) / 8;
2048b975bd3SMarkus F.X.J. Oberhumer #  else
2058b975bd3SMarkus F.X.J. Oberhumer #    error "missing endian definition"
2068b975bd3SMarkus F.X.J. Oberhumer #  endif
2078b975bd3SMarkus F.X.J. Oberhumer #else
2088b975bd3SMarkus F.X.J. Oberhumer 		if (unlikely(ip[m_len] == m_pos[m_len])) {
2098b975bd3SMarkus F.X.J. Oberhumer 			do {
2108b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2118b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2128b975bd3SMarkus F.X.J. Oberhumer 					break;
2138b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2148b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2158b975bd3SMarkus F.X.J. Oberhumer 					break;
2168b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2178b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2188b975bd3SMarkus F.X.J. Oberhumer 					break;
2198b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2208b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2218b975bd3SMarkus F.X.J. Oberhumer 					break;
2228b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2238b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2248b975bd3SMarkus F.X.J. Oberhumer 					break;
2258b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2268b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2278b975bd3SMarkus F.X.J. Oberhumer 					break;
2288b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2298b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2308b975bd3SMarkus F.X.J. Oberhumer 					break;
2318b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2328b975bd3SMarkus F.X.J. Oberhumer 				if (unlikely(ip + m_len >= ip_end))
2338b975bd3SMarkus F.X.J. Oberhumer 					goto m_len_done;
2348b975bd3SMarkus F.X.J. Oberhumer 			} while (ip[m_len] == m_pos[m_len]);
2358b975bd3SMarkus F.X.J. Oberhumer 		}
2368b975bd3SMarkus F.X.J. Oberhumer #endif
2378b975bd3SMarkus F.X.J. Oberhumer 		}
2388b975bd3SMarkus F.X.J. Oberhumer m_len_done:
23964c70b1cSRichard Purdie 
2408b975bd3SMarkus F.X.J. Oberhumer 		m_off = ip - m_pos;
2418b975bd3SMarkus F.X.J. Oberhumer 		ip += m_len;
2428b975bd3SMarkus F.X.J. Oberhumer 		if (m_len <= M2_MAX_LEN && m_off <= M2_MAX_OFFSET) {
24364c70b1cSRichard Purdie 			m_off -= 1;
2448b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (((m_len - 1) << 5) | ((m_off & 7) << 2));
24564c70b1cSRichard Purdie 			*op++ = (m_off >> 3);
24664c70b1cSRichard Purdie 		} else if (m_off <= M3_MAX_OFFSET) {
24764c70b1cSRichard Purdie 			m_off -= 1;
2488b975bd3SMarkus F.X.J. Oberhumer 			if (m_len <= M3_MAX_LEN)
24964c70b1cSRichard Purdie 				*op++ = (M3_MARKER | (m_len - 2));
2508b975bd3SMarkus F.X.J. Oberhumer 			else {
2518b975bd3SMarkus F.X.J. Oberhumer 				m_len -= M3_MAX_LEN;
25264c70b1cSRichard Purdie 				*op++ = M3_MARKER | 0;
2538b975bd3SMarkus F.X.J. Oberhumer 				while (unlikely(m_len > 255)) {
25464c70b1cSRichard Purdie 					m_len -= 255;
25564c70b1cSRichard Purdie 					*op++ = 0;
25664c70b1cSRichard Purdie 				}
25764c70b1cSRichard Purdie 				*op++ = (m_len);
25864c70b1cSRichard Purdie 			}
2598b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (m_off << 2);
2608b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (m_off >> 6);
2618b975bd3SMarkus F.X.J. Oberhumer 		} else {
2628b975bd3SMarkus F.X.J. Oberhumer 			m_off -= 0x4000;
2638b975bd3SMarkus F.X.J. Oberhumer 			if (m_len <= M4_MAX_LEN)
2648b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (M4_MARKER | ((m_off >> 11) & 8)
2658b975bd3SMarkus F.X.J. Oberhumer 						| (m_len - 2));
2668b975bd3SMarkus F.X.J. Oberhumer 			else {
2678b975bd3SMarkus F.X.J. Oberhumer 				m_len -= M4_MAX_LEN;
2688b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (M4_MARKER | ((m_off >> 11) & 8));
2698b975bd3SMarkus F.X.J. Oberhumer 				while (unlikely(m_len > 255)) {
2708b975bd3SMarkus F.X.J. Oberhumer 					m_len -= 255;
2718b975bd3SMarkus F.X.J. Oberhumer 					*op++ = 0;
27264c70b1cSRichard Purdie 				}
2738b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (m_len);
2748b975bd3SMarkus F.X.J. Oberhumer 			}
2758b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (m_off << 2);
27664c70b1cSRichard Purdie 			*op++ = (m_off >> 6);
27764c70b1cSRichard Purdie 		}
278*5ee4014aSDave Rodgman 		*state_offset = -2;
279*5ee4014aSDave Rodgman finished_writing_instruction:
280*5ee4014aSDave Rodgman 		ii = ip;
2818b975bd3SMarkus F.X.J. Oberhumer 		goto next;
28264c70b1cSRichard Purdie 	}
28364c70b1cSRichard Purdie 	*out_len = op - out;
2848b975bd3SMarkus F.X.J. Oberhumer 	return in_end - (ii - ti);
28564c70b1cSRichard Purdie }
28664c70b1cSRichard Purdie 
2878b975bd3SMarkus F.X.J. Oberhumer int lzo1x_1_compress(const unsigned char *in, size_t in_len,
2888b975bd3SMarkus F.X.J. Oberhumer 		     unsigned char *out, size_t *out_len,
2898b975bd3SMarkus F.X.J. Oberhumer 		     void *wrkmem)
29064c70b1cSRichard Purdie {
2918b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char *ip = in;
29264c70b1cSRichard Purdie 	unsigned char *op = out;
2938b975bd3SMarkus F.X.J. Oberhumer 	size_t l = in_len;
2948b975bd3SMarkus F.X.J. Oberhumer 	size_t t = 0;
295*5ee4014aSDave Rodgman 	signed char state_offset = -2;
296*5ee4014aSDave Rodgman 
297*5ee4014aSDave Rodgman 	// LZO v0 will never write 17 as first byte,
298*5ee4014aSDave Rodgman 	// so this is used to version the bitstream
299*5ee4014aSDave Rodgman 	*op++ = 17;
300*5ee4014aSDave Rodgman 	*op++ = LZO_VERSION;
30164c70b1cSRichard Purdie 
3028b975bd3SMarkus F.X.J. Oberhumer 	while (l > 20) {
3038b975bd3SMarkus F.X.J. Oberhumer 		size_t ll = l <= (M4_MAX_OFFSET + 1) ? l : (M4_MAX_OFFSET + 1);
3048b975bd3SMarkus F.X.J. Oberhumer 		uintptr_t ll_end = (uintptr_t) ip + ll;
3058b975bd3SMarkus F.X.J. Oberhumer 		if ((ll_end + ((t + ll) >> 5)) <= ll_end)
3068b975bd3SMarkus F.X.J. Oberhumer 			break;
3078b975bd3SMarkus F.X.J. Oberhumer 		BUILD_BUG_ON(D_SIZE * sizeof(lzo_dict_t) > LZO1X_1_MEM_COMPRESS);
3088b975bd3SMarkus F.X.J. Oberhumer 		memset(wrkmem, 0, D_SIZE * sizeof(lzo_dict_t));
309*5ee4014aSDave Rodgman 		t = lzo1x_1_do_compress(ip, ll, op, out_len,
310*5ee4014aSDave Rodgman 					t, wrkmem, &state_offset);
3118b975bd3SMarkus F.X.J. Oberhumer 		ip += ll;
31264c70b1cSRichard Purdie 		op += *out_len;
3138b975bd3SMarkus F.X.J. Oberhumer 		l  -= ll;
31464c70b1cSRichard Purdie 	}
3158b975bd3SMarkus F.X.J. Oberhumer 	t += l;
31664c70b1cSRichard Purdie 
31764c70b1cSRichard Purdie 	if (t > 0) {
3188b975bd3SMarkus F.X.J. Oberhumer 		const unsigned char *ii = in + in_len - t;
31964c70b1cSRichard Purdie 
32064c70b1cSRichard Purdie 		if (op == out && t <= 238) {
32164c70b1cSRichard Purdie 			*op++ = (17 + t);
32264c70b1cSRichard Purdie 		} else if (t <= 3) {
323*5ee4014aSDave Rodgman 			op[state_offset] |= t;
32464c70b1cSRichard Purdie 		} else if (t <= 18) {
32564c70b1cSRichard Purdie 			*op++ = (t - 3);
32664c70b1cSRichard Purdie 		} else {
32764c70b1cSRichard Purdie 			size_t tt = t - 18;
32864c70b1cSRichard Purdie 			*op++ = 0;
32964c70b1cSRichard Purdie 			while (tt > 255) {
33064c70b1cSRichard Purdie 				tt -= 255;
33164c70b1cSRichard Purdie 				*op++ = 0;
33264c70b1cSRichard Purdie 			}
33364c70b1cSRichard Purdie 			*op++ = tt;
33464c70b1cSRichard Purdie 		}
3358b975bd3SMarkus F.X.J. Oberhumer 		if (t >= 16) do {
3368b975bd3SMarkus F.X.J. Oberhumer 			COPY8(op, ii);
3378b975bd3SMarkus F.X.J. Oberhumer 			COPY8(op + 8, ii + 8);
3388b975bd3SMarkus F.X.J. Oberhumer 			op += 16;
3398b975bd3SMarkus F.X.J. Oberhumer 			ii += 16;
3408b975bd3SMarkus F.X.J. Oberhumer 			t -= 16;
3418b975bd3SMarkus F.X.J. Oberhumer 		} while (t >= 16);
3428b975bd3SMarkus F.X.J. Oberhumer 		if (t > 0) do {
34364c70b1cSRichard Purdie 			*op++ = *ii++;
34464c70b1cSRichard Purdie 		} while (--t > 0);
34564c70b1cSRichard Purdie 	}
34664c70b1cSRichard Purdie 
34764c70b1cSRichard Purdie 	*op++ = M4_MARKER | 1;
34864c70b1cSRichard Purdie 	*op++ = 0;
34964c70b1cSRichard Purdie 	*op++ = 0;
35064c70b1cSRichard Purdie 
35164c70b1cSRichard Purdie 	*out_len = op - out;
35264c70b1cSRichard Purdie 	return LZO_E_OK;
35364c70b1cSRichard Purdie }
35464c70b1cSRichard Purdie EXPORT_SYMBOL_GPL(lzo1x_1_compress);
35564c70b1cSRichard Purdie 
35664c70b1cSRichard Purdie MODULE_LICENSE("GPL");
35764c70b1cSRichard Purdie MODULE_DESCRIPTION("LZO1X-1 Compressor");
358